百川智能发布超千亿大模型Baichuan 3，ai+医疗又有新思路？

AI应用信息1年前 (2024)发布 XIAOT

百川智能发布超千亿大模型Baichuan 3 2024年1月29日，百川智能发布了具有超过千亿参数的大型语言模型Baichuan 3。

Baichuan 3在各方面都展示出了显著的突破，特别在中文任务上，其性能超过了GPT-4。## 创新突破 Baichuan 3在CMMLU、GAOKAO和AGI-Eval等标杆通用能力评测中表现了优秀的性能，特别在中文任务上更是大幅度超过了GPT-4。

在数学和编程领域的专业任务如MATH、HumanEval和MBPP评测中，Baichuan 3也有出色的表现。百川智能对Baichuan 3在医疗领域的能力进行了定向优化，在对逻辑推理能力和专业性要求极高的评测任务如MCMLE、MedExam和CMExam中，Baichuan 3的中文效果超过了GPT-4，成为中文医疗任务表现最佳的大模型。此外，Baichuan 3突破了“迭代式强化学习”技术，提升了语义理解和生成能力，并在诗词创作的格式、韵律、表意等方面表现出领先于其他大模型的优势。## 医疗领域表现在医疗领域，大模型的全能特性发挥着至关重要的作用。百川智能在预训练阶段为Baichuan 3构建了超过千亿Token的医疗数据集，确保了模型在医疗领域的专业度和知识深度。

在推理阶段，百川智能通过准确的任务描述和适当的示例样本选择，让模型输出更准确和符合逻辑的推理步骤，从而显著提高了Baichuan 3在医疗领域的任务效果。

具体来说，Baichuan 3在MCMLE、MedExam、CMExam等中文医疗任务的评测成绩超过GPT-4。## 创作精准度提升百川智能强调，通过结合”RLHF&RLAIF”以及迭代式强化学习的方法，Baichuan 3提高了语义理解和生成创作能力，使模型在诗词创作任务中达到了全新的优秀水平。比较GPT-4，Baichuan 3的诗词创作能力提升了500%。百川智能的这种创新手段和方案在训练过程中显著提高了Baichuan 3的各种能力。在训练效率方面，Baichuan 3的训练框架在性能上比主流框架提高了超过30%。