2024 年 1 月 9 日,百川智能发布角色大模型 BAIchuan-NPC,深度优化了“角色知识”和“对话能力”,使模型能够更好的理解上下文对话语义,更加符合人物性格地进行对话和行动。
此外,对于游戏领域 AI 角色开发成本高、周期长、自由度差、API 不稳定等诸多不足, 百川智能推出了“角色创建平台 + 搜索增强知识库”的定制化解决方案。通过这一方案,游戏厂商无需编写任何代码,只需通过简单的文字描述,便可以快速构建出自己需要的角色,实现低成本、高效率的角色定制。
相关链接:https://npc.baichuan-ai.com
大模型拓展了传媒、游戏、影视等诸多领域数字角色的想象空间。其中游戏行业作为科技创新的“试验田”,受到的影响尤其明显。大模型强大的生成能力、流畅的自然交互方式,将改变游戏的开发流程,重构游戏体验早已成为业内共识。但如何将大模型这个新技术融入成熟的游戏研发流程,依旧挑战重重。其中目前最大的问题是,当下的大模型在角色扮演上依旧“不够拟人”,这会直接破坏用户与角色的互动感受,使游戏丧失沉浸感。
模型在角色扮演中是否足够“拟人”,主要由模型的基础能力和角色扮演一致性两个方面来决定。
对于角色扮演而言,模型的基础能力既包括模型的通用智能水准,还包含角色知识、对话能力、情节演绎以及逻辑推理四个专项能力。而强化这些能力的最佳方式是在预训练阶段通过高质量数据集进行针对性训练。
百川智能收集了海量行业网站、高质量书籍、优质剧本数据,对 Baichuan-NPC 进行了超过 3T tokens 的领域知识预训练。此外,Baichuan-NPC 还创新性地使用多方法模型合成数据进行预训练阶段的领域知识增强,针对性地缓解了 Reversal Curse 问题,大幅度提升 Token 利用效率。
角色扮演一致性问题指的是,通用语言模型在角色“演绎”过程中,非常容易跳出“角色设定”变回“智能助手”或做出不符合角色人设的言行,即业界所说的 OOC 问题(角色言行偏离原有设定,如:古代人物谈论现代事物)。
针对这一问题,百川智能首创将思维链对齐技术引入到角色模型对齐中。使用带有思维链的数据构造方式和带有思维链对齐的强化对齐方法,双管齐下让模型的思考过程和思考之后的行动表现更接近人类,大幅提升了角色一致性,显著增强模型的基础对话能力和角色演绎能力。
Baichuan-NPC 通过强化模型基础能力,使用思维链对齐技术赋予角色模型类人的思考能力,使模型能够敏锐地捕捉上下文对话语义,生成更加符合人物性格地对话和行动,让角色效果栩栩如生。
在 CharacterEval(由中国人民大学高瓴人工智能学院、北京邮电大学人工智能学院联合推出的对话类角色扮演 Agent 评估标准)评测中,Baichuan-NPC 在对话能力、角色一致性、扮演吸引力等方面大幅领先,是目前中文领域最强角色模型。
将大模型的角色构建能力应用于具体场景,除了模型要具备强大的基础能力,简洁高效的开发流程同样至关重要。
当前行业内的角色构建主要通过 API 调用实现。在实际创作中,需要产品、运营、技术等多个部门共同协作、反复调试,开发流程门槛高、周期长、效率低,最终的角色效果还难以保障。
对此,百川智能在 Baichuan-NPC 基础上推出了由“角色创建平台 + 搜索增强知识库”组成的开发套件,通过标准化模板、自定义选项、所见即得的调优界面及搜索增强知识库,为用户提供了一个高度自由且无需编写代码的低成本解决方案。
百川智能角色创建平台官网
为提高角色定制自由度,百川智能自研了强多轮对齐和搜索增强知识库两项特色技术。强多轮对齐技术通过精心设计 System prompt 中的角色设定字段,强化了角色创建平台 System Prompt 在对话 Session 中的特殊地位,保证了角色言行响应系统指令定制的敏感性和鲁棒性。简单来说,用户在系统提示(System Prompt)中定义了角色特征后,角色就会完全遵循用户设定进行相应的“演绎”。
不同性格孙悟空的不同演绎
AI 角色知识储备量是决定能否自由定制角色的另一个重要因素。如果 AI 角色缺乏与其身份相符的知识,即使角色“演绎”的再努力,也会让人感觉“不真实”。
百川智能将搜索技术与角色知识能力深度融合,基于最新研发的 SOTA 模型 BCTE(Baichuan-Text-Embedding),针对角色扮演场景优化了建库和召回算法,为角色和知识库提供了灵活的“多对多”关联方式。用户只需上传角色所需的知识文档并自定义回复方式,就能显著降低角色产生幻觉的可能性,极大地丰富了角色“内涵”。
创建好角色只是完成了角色定制的第一步,想要真正落到真实场景,还需要微调优化让其达到最佳效果。百川角色创建平台将微调选项和角色对话效果实时整合,实现了调优过程的“所调即所见”。
角色调试与生成效果实时同步
此外,平台还提供了一键复制功能。完成角色调试后,用户可以在查看代码页面一键复制全部角色代码,然后将角色代码集成到业务场景中。这种“所调即所得”的方式,极大降低了开发门槛,有效缩减了企业定制角色的时间和人员成本。
角色调试完成即可一键复制角色代码
目前,百川智能已经与众多泛娱乐行业的头部品牌建立了深度合作关系,共同拓展 AIGC 创作的应用场景。