《中国大模型市场主流产品评估，2024》报告发布

6月12日，国际数据公司IDC发布《中国大模型市场主流产品评估，2024》。IDC此次采取实测的方式，成立产品测试团队，通过多个维度对基础大模型及相关产品进行评测，并邀请外部专家团队深入分析各个产品答案准确性、合理性等，在审核委员会的监督下，最终得出各厂商的评估结果，供用户选型参考。

在基础能力评测中，大模型产品在问答理解类、推理类和创作表达类的成熟度较高。百度文心大模型在当前关注度高的多模态、安全、文本风格迁移等细类评估中表现出色，体现出强大的基础模型能力。在数学类和代码类等考验模型逻辑、推理等能力的评测中，百度文心大模型体现出强大的体系化思维、逻辑思维和抽象思维能力。在代码类所有6个细分维度中，百度均入围优势厂商。据了解，基于文心大模型百度研制了智能代码助手Comate，目前整体采纳率已达46%，新增代码中生成比例已达27%。

应用能力评测主要评估大模型产品在办公工具、生活助手等toC通用场景类和toB特定行业类的表现。评测结果显示，百度文心大模型在搜索、写邮件、文生图表等办公场景和衣食住行、生活服务、闲聊创意等生活助手场景中具备优势。此外，文心大模型已经在能源、金融、媒体、医疗、通信、制造、交通、互联网等行业形成广泛的落地应用生态，通过大模型解决诸多场景的实际问题。

此外报告显示，在行业落地上，百度智能云推出千帆大模型平台，以一站式企业级大模型开发及服务运行平台服务大众。2024年5月底，百度宣布文心大模型的两款主力模型ERNIE Speed、ERNIE Lite免费。

IDC认为，从2024年二季度开始，中国市场迎来了一波基础大模型及产品的更新升级。IDC中国大模型产品测试团队表示，2024年产业界更加关注大模型和生成式AI的落地，技术供应商需持续优化生成质量，提高生成速度并降低大模型使用成本，加快大模型技术的应用与普及。