​百川智能发布超千亿大模型Baichuan 3,ai+医疗又有新思路?

AI应用信息10个月前发布 XIAOT
78 0

百川智能发布超千亿大模型BAIchuan 3     2024年1月29日,百川智能发布了具有超过千亿参数的大型语言模型Baichuan 3。

Baichuan 3在各方面都展示出了显著的突破,特别在中文任务上,其性能超过了GPT-4。## 创新突破     Baichuan 3在CMMLU、GAOKAO和AGI-Eval等标杆通用能力评测中表现了优秀的性能,特别在中文任务上更是大幅度超过了GPT-4。

在数学和编程领域的专业任务如MATH、HumanEval和MBPP评测中,Baichuan 3也有出色的表现。    百川智能对Baichuan 3在医疗领域的能力进行了定向优化,在对逻辑推理能力和专业性要求极高的评测任务如MCMLE、MedExam和CMExam中,Baichuan 3的中文效果超过了GPT-4,成为中文医疗任务表现最佳的大模型。     此外,Baichuan 3突破了“迭代式强化学习”技术,提升了语义理解和生成能力,并在诗词创作的格式、韵律、表意等方面表现出领先于其他大模型的优势。## 医疗领域表现    在医疗领域,大模型的全能特性发挥着至关重要的作用。百川智能在预训练阶段为Baichuan 3构建了超过千亿token的医疗数据集,确保了模型在医疗领域的专业度和知识深度。

在推理阶段,百川智能通过准确的任务描述和适当的示例样本选择,让模型输出更准确和符合逻辑的推理步骤,从而显著提高了Baichuan 3在医疗领域的任务效果。

具体来说,Baichuan 3在MCMLE、MedExam、CMExam等中文医疗任务的评测成绩超过GPT-4。## 创作精准度提升   百川智能强调,通过结合”RLHF&RLAIF”以及迭代式强化学习的方法,Baichuan 3提高了语义理解和生成创作能力,使模型在诗词创作任务中达到了全新的优秀水平。比较GPT-4,Baichuan 3的诗词创作能力提升了500%。  百川智能的这种创新手段和方案在训练过程中显著提高了Baichuan 3的各种能力。在训练效率方面,Baichuan 3的训练框架在性能上比主流框架提高了超过30%。

    © 版权声明

    相关文章