文心大模型4.0首发，AI“生成未来”

AI应用信息1年前 (2024)发布 XIAOT

“我们即将进入一个AI原生的时代！”在首钢冰球馆的工业文化魅力与人工智能的科幻感交相呼应下，百度创始人、董事长兼首席执行官李彦宏在百度世界大会2023舞台上开启了一场以AI原生应用为主题的演讲，并宣布文心大模型4.0正式发布。从赶超同行到齐头并进，从勉力研发到繁荣生态，AI大模型在我国正掀起一场从技术创新到商业、工业等各行各业变革的浪潮。

文心4.0四大能力全面提升

“文心大模型4.0实现了基础模型的全面升级，在理解、生成、逻辑和记忆能力上都有着明显提升，综合水平与GPT-4相比毫不逊色。”一开场，李彦宏就为大众带来了令人振奋的消息，我国自主研发的AI大模型综合能力已比肩国际顶尖大模型。

基于文心大模型4.0，李彦宏依次演示了四大能力的特点与应用场景。在理解能力上，他通过询问住房公积金异地贷款政策的案例，展示了文心一言对前后乱序、模糊意图、潜台词等复杂提示词的理解力，例如文心一言能够在这一场景中将“在北京工作”的通俗表达等同于“在北京缴纳公积金”这一潜台词等。

在生成能力上，李彦宏展示了文心一言如何在短短几分钟内，根据一张素材图片，迅速生成一组广告海报、五条广告文案以及一条营销视频。据介绍，基于这一系列能力，百度已经推出了AIGC营销创意平台擎舵，让“一个人就成为一支AI营销队伍”。

同时，他还通过解数学题、总结知识点等场景，展示了大模型的逻辑能力；通过数千字的小说撰写和角色、情节设置，体现了大模型的记忆能力；以及医生数字人帮助患者解读药品说明书，来展现四大能力的综合应用。

“理解和生成能力的提升幅度相近，而逻辑和记忆能力的提升则更大，逻辑的提升幅度达到理解的近3倍，记忆的提升幅度也达到了理解的2倍多。”百度首席技术官王海峰说。

星河计划再育500万大模型人才

在李彦宏现场亮出新版大模型四大能力的同时，王海峰对文心一言的基础模型，即文心大模型4.0背后的关键技术和最新进展进行了解读。据悉，文心大模型4.0在9月已开始小流量上线，过去一个多月效果又提升了近30%。8月31日文心一言面向全社会开放至今，用户规模已经达到4500万，开发者5.4万，场景4300个，应用825个，插件超过500个。百度基于文心大模型研制了智能代码助手Comate，从内部应用效果来看，整体的代码采纳率达到40%，高频用户的代码采纳率达到60%。

据悉，此前文心一言的基础模型在5月升级至文心大模型3.5，在基础模型升级、精调技术创新、知识点增强、逻辑推理增强、插件机制等方面创新突破，取得效果和效率的提升。

王海峰介绍，文心大模型4.0基本技术架构与3.0和3.5版本一脉相承，并在多个关键技术方向上进一步创新突破。例如，在万卡算力上运行飞桨平台，通过集群基础设施和调度系统、飞桨框架的软硬协同优化，支持了大模型的稳定高效训练。建设了多维数据体系，形成了数据挖掘、分析、合成、标注、评估闭环，充分释放数据价值，大幅提升模型效果。基于有监督精调、偏好学习、强化学习等技术进行多阶段对齐，保障模型更好地与人类的判断和选择对齐。可再生训练技术通过增量式的参数调优，有效节省了训练资源和时间，加快了模型迭代速度。

此外，文心大模型4.0在输入和输出阶段都进行知识点增强。一方面，对用户输入的问题进行理解，并拆解出回答问题所需的知识点，然后在搜索引擎、知识图谱、数据库中查找准确知识，最后把这些找到的知识组装进Prompt送入大模型，准确率好，效率也高；另一方面，对大模型的输出进行反思，从生成结果中拆解出知识点，然后再利用搜索引擎、知识图谱、数据库，以及大模型本身进行确认，进而对有差错的点进行修正。

为满足源源不断的大模型技术创新和产业应用需求，王海峰在现场发布了百度人才培养星河计划。“我们将与产学研各界密切合作，深化产教融合，为社会再培养500万大模型人才，让人工智能科技的‘创新之花’，结出更多‘产业之果’，服务国家战略，服务社会发展，服务人民福祉。”王海峰说。数据显示，百度在2020年提出5年为全社会培养500万AI人才，截至目前其已培养了420万AI人才。

AI原生“生成未来”

人工智能大模型能够释放各行各业源源不绝的新生产力，这无疑是这轮席卷全球的技术浪潮未来更重要的流向。如何才能抓住这背后蕴藏的巨大机遇？百度的答案是——AI原生应用。

所谓AI原生应用，就是基于大模型的理解、生成、逻辑和记忆能力开发出来的应用。李彦宏认为，这些能力是过去所不具备的，因而能够打开无限的创新空间。李彦宏在以《手把手教你做AI原生应用》为主题的演讲中发布了新搜索、新地图等十余款AI原生应用。

搜索业务是百度早年间起家时的核心产品。如今，百度搜索也已经基于AI大模型完成重构。李彦宏介绍，百度新搜索具有极致满足、推荐激发和多轮交互三个特点，当用户搜索问题时，新搜索将“不再是给你一堆链接”，而是通过对内容的理解，生成文字、图片、动态图表的多模态答案，让用户一步获取答案。在针对复杂需求时，“多轮交互”特点也可以通过提示、调整等方式，满足用户更个性化的搜索需求。

会上，国内首个生成式商业智能产品百度GBI发布，它可以把商业分析师十几天才能完成的数据分析、撰写报告的工作，缩短到分钟级。通过AI重构的智能办公平台新如流，则可以实现1000条群聊消息一秒划重点等功能，成为办公人士的智能助理，让“智能工作”代替“勤奋工作”。

通过对海量文档、图片和视频的理解和再生成，百度网盘和文库拥有了创作能力：网盘不仅能精准定位到视频某一帧，还能在几秒钟内总结完长达1小时的视频内容，并从中提炼出金句和要点；文库则可基于10亿优质资料实现写稿和做PPT等工作，成为“生产力工具”。

正如李彦宏此前所说，AI原生应用不是对移动互联网App和PC软件的简单重复，而是要能“解决过去解决不了或解决不好的问题”。

“大量AI原生应用将不断涌现，数字技术与实体经济将深度融合……大模型正成为新型工业化的重要推动力。”李彦宏说。正如百度世界大会2023的主题是“生成未来”，在演讲结尾，李彦宏表示，我们即将进入一个AI原生的时代，进入一个人机通过Prompt来交互的时代。据悉，自10月17日起，企业用户可登录百度智能云官网，在千帆大模型平台上申请测试文心大模型4.0的API接口。