唯一算法满分，7项满分！文心大模型3.5到底有多顶？

AI应用信息1年前 (2024)发布 XIAOT

国内百“模”大战下，究竟谁实力最强？全球领先的IT市场研究和咨询公司IDC最新发布的《AI 大模型技术能力评估报告，2023》给出了答案。

百度文心大模型拿下12项指标的7个满分，综合评分第一，尤其是算法模型、通用能力等基础技术领跑全行业，算法模型获得唯一一个满分。

IDC报告指出，百度AI 大模型整体竞争力位于领先水平，在模型能力、工具平台、生态布局以及行业覆盖上优势明显，并已提前进入商业化落地探索阶段。

IDC《AI大模型技术能力评估报告，2023》，百度7项满分、综合评分第一

行业首个大模型评估框架，百度文心7项满分、综合评分第一

这是IDC首次提出AI大模型技术能力评估框架，结果显示，百度文心是这场大模型技术突破者和应用引领者。大模型的发展为通用人工智能带来了曙光，而“算法模型”能力无疑是大模型能力最为核心的要素，也是决定大模型应用效果的根本所在。只有通过算法模型技术的突破，实现具有通用效果优势的大模型底座，才能支撑各行各业充分享受技术突破带来的红利，破解AI落地门槛高的困境。

文心大模型在此次IDC评估中获得了算法模型维度的唯一一个满分，充分体现了百度在大模型核心技术上的领先优势。百度自2019年开始深耕预训练模型研发，先后发布知识增强文心系列模型。前不久，百度正式发布文心大模型3.5版本，进一步在基础模型、知识增强、检索增强等多项核心技术上取得创新，新版本在各项能力上均有明显提升。

多个公开测评显示，文心大模型3.5版支持下的文心一言中文能力突出，甚至有超出GPT-4 的表现；综合能力在评测中超过ChatGPT，遥遥领先于其他大模型。

文心大模型取得“第一”得益于百度“芯片-框架-模型-应用”四层技术栈优势、知识增强的核心特色和繁荣的大模型生态三大优势。

百度文心大模型全景图

据报道，百度拥有自研的深度学习平台飞桨有力支撑了大模型的高效训练和推理。飞桨与文心的协同优化，让文心大模型3.5最新版本的模型效果提升50%，训练速度提升2倍，推理速度提升30倍。知识增强作为文心大模型的核心特色之一，实现了更高的效率、更好的效果、更强的可解释性。

在大模型生态方面，百度文心已形成企业、教育、社区三位一体的生态体系。最新数据显示，百度有超过750万开发者基础，20万企业生态基础，多层次开展大模型人才培训、企业赋能、开发者运营。百度还设立了10亿创投基金鼓励大模型创意、繁荣大模型生态。

大模型从已用、可用到易用，文心拥有中国最大产业应用规模

AI大模型已经从拼参数发展到拼应用，进入大规模可复制的产业落地阶段。百度文心大模型源于产业实践，服务于产业实践，业内首次提出了行业大模型的落地思路，联合国家电网、浦发银行、泰康、吉利、哈尔滨市、深圳燃气、TCL、上海辞书出版社等企业单位，合作发布了11个行业大模型，是业内最早和广泛深入推动行业大模型的厂商。

IDC评估结果显示，百度文心大模型在行业覆盖上获得满分成绩，在能源、金融、教育、医疗等领域已经实现广泛业务布局和落地场景探索。

据介绍，文心大模型已经拥有中国最大的产业应用规模，目前有15万家企业申请接入文心一言测试。百度智能云与300多家生态伙伴，在超过400个场景中已取得相当不错的测试效果。

以能源电力为例，百度为世界上最大的电网——国家电网，用AI预测用电高峰波谷，为电网调度提供建议，用无人机加图像识别巡检线路，保障供电平稳，并联合发布电力行业大模型。百度智能云联手山西国峰煤电，基于大模型技术打造智能运行方案，平均每年降低电厂运行成本600万，减少1.06万吨碳排放。

未来所有的企业都会强依赖大模型，所有的产品都会基于大模型来开发。对大模型技术厂商来说，建立一套完整的生态系统可以让大型模型从“已用”、“可用”变为“易用”，进一步推动人工智能的发展。

百度文心大模型将助力千行百业的中国企业将大模型内化为自身的生产力工具，走上智能化转型升级的快车道，构建面向全球的强大竞争力。