6月12日,国际数据公司IDC发布《中国大模型市场主流产品评估,2024》。IDC此次采取实测的方式,成立产品测试团队,通过多个维度对基础大模型及相关产品进行评测,并邀请外部专家团队深入分析各个产品答案准确性、合理性等,在审核委员会的监督下,最终得出各厂商的评估结果,供用户选型参考。
在基础能力评测中,大模型产品在问答理解类、推理类和创作表达类的成熟度较高。百度文心大模型在当前关注度高的多模态、安全、文本风格迁移等细类评估中表现出色,体现出强大的基础模型能力。在数学类和代码类等考验模型逻辑、推理等能力的评测中,百度文心大模型体现出强大的体系化思维、逻辑思维和抽象思维能力。在代码类所有6个细分维度中,百度均入围优势厂商。据了解,基于文心大模型百度研制了智能代码助手Comate,目前整体采纳率已达46%,新增代码中生成比例已达27%。
应用能力评测主要评估大模型产品在办公工具、生活助手等toC通用场景类和toB特定行业类的表现。评测结果显示,百度文心大模型在搜索、写邮件、文生图表等办公场景和衣食住行、生活服务、闲聊创意等生活助手场景中具备优势。此外,文心大模型已经在能源、金融、媒体、医疗、通信、制造、交通、互联网等行业形成广泛的落地应用生态,通过大模型解决诸多场景的实际问题。
此外报告显示,在行业落地上,百度智能云推出千帆大模型平台,以一站式企业级大模型开发及服务运行平台服务大众。2024年5月底,百度宣布文心大模型的两款主力模型ERNIE Speed、ERNIE Lite免费。
IDC认为,从2024年二季度开始,中国市场迎来了一波基础大模型及产品的更新升级。IDC中国大模型产品测试团队表示,2024年产业界更加关注大模型和生成式AI的落地,技术供应商需持续优化生成质量,提高生成速度并降低大模型使用成本,加快大模型技术的应用与普及。