文心大模型升级3.5版本,有多强?我们帮你试了试

AI应用信息10个月前发布 XIAOT
103 0
三个多月前,机器之心向刚刚诞生的文心一言提过一个问题:
「设有三个房间,每个房间都有⼀个开关,其中⼀个控制着同⼀楼层的⼀个电灯。你现在在开关所在的楼层,不能看到电灯所在的楼层。你只能上楼⼀次,然后必须确定哪个开关对应哪个电灯。请问如何推理以确定正确的开关?」
对于大部分人,这道逻辑推理题确实有点绕,对于当时的文心一言来说亦有难度。从结果中,我们可以看出文心一言进行了分析,有思维链,但忽略了「只能上楼一次」这个条件,所以最后给出的结果并不是完全正确的:
文心大模型升级3.5版本,有多强?我们帮你试了试
但今天,站在你面前的,是基于「文心大模型 3.5」的文心一言。
面对同一个问题,现在它的回答是这样的:
文心大模型升级3.5版本,有多强?我们帮你试了试
从三月中旬推出到现在,文心一言始终在悄悄努力变优秀。这种变化的背后,是文心大模型的不断进化、迭代。
上个月,百度文心大模型正式从 3.0 升级到 3.5,不仅实现了创作、问答、推理和代码能力上全面升级,安全性显著提升,训练和推理速度也大幅提升。
在今天开幕的世界人工智能大会上,作为国产大模型的代表之作,文心大模型 3.5 毫不意外地吸引了众人的目光。
WAIC 产业全体论坛上,百度首席技术官王海峰带来了文心大模型 3.5 的深入解读。
文心大模型升级3.5版本,有多强?我们帮你试了试
现场,王海峰展示了一组数据:通过各项算法和数据的优化,相比于 3.0 版本,文心大模型 3.5 的模型效果累计提升超过 50%,训练速度提升了 2 倍,推理速度提升了 30 倍。
对文心一言的所有个人及企业用户乃至全行业来说,这意味着一个新的阶段。
最新版文心一言,做了哪些改变?
作为百度自主研发的大模型体系,文心大模型的诞生要追溯到 2019 年 3 月,发展到现在文心的基础模型涵盖了 NLP、视觉、跨模态等多个领域,每个领域涵盖不同的能力模型,比如对话模型、代码生成模型、文图生成模型等。
到了 2021 年,文心 3.0 已是百亿级别的大模型。演变至今,文心大模型已从最初的自然语言理解大模型,发展成了跨语言、跨模态、跨任务、跨行业的能力完备的大模型平台。
在文心大模型 3.5 加持的文心一言中,问答、推理、代码、文生图等能力都向前迈了一步。这些变化,文心一言的用户们在对话过程中也能体会到。这里,我们通过几个例子感受一下:
「疯狂星期四是什么?」「为什么很多人都在说 V 我 50?」如果一位 2g 冲浪的网友抱有这个疑惑,去问 3.0 版本加持的文心一言,得到的回答可能是这样的:
文心大模型升级3.5版本,有多强?我们帮你试了试
而现在,3.5 版本加持的文心一言不仅能够给出正确答案,还能进一步解释「疯狂星期四」的名词来源、活动背景等信息,甚至还能指导你参与活动。而且对于「V 我 50」这个流行语,文心一言 3.5 还能找到最早的出处。
文心大模型升级3.5版本,有多强?我们帮你试了试
再试试代码能力。下面是「生成一个斐波那契数列」的对比:
文心大模型升级3.5版本,有多强?我们帮你试了试
最新生成的结果,额外解释了斐波那契数列的概念,并给出了简洁的 Python 代码:
文心大模型升级3.5版本,有多强?我们帮你试了试
同样的领悟能力提升还体现在「文生图」上,下面这张是机器之心在三月份的测试结果,从风格上说更偏 CG 绘画:
文心大模型升级3.5版本,有多强?我们帮你试了试
而最新生成的结果更加符合人们熟悉的二次元风格了:
文心大模型升级3.5版本,有多强?我们帮你试了试
此外,在最新版本的文心一言中,用户感受到的一大变化是引入了插件机制,目前提供了两个选项:
文心大模型升级3.5版本,有多强?我们帮你试了试
第一个是默认内置插件「百度搜索」,使得文心一言具备生成实时准确信息的能力。
我们知道,如果不接入互联网,对话式 AI 所提供的信息通常会受到训练数据输入时间的限制。但现在,你能问它许多「新鲜热乎」的问题了。
比如,向文心一言提问:「最近的热门电视剧有哪些?」
 
文心大模型升级3.5版本,有多强?我们帮你试了试
提问时间:2023 年 7 月 6 日
再比如,要求文心一言绘制出近日北京市的气温变化情况:
文心大模型升级3.5版本,有多强?我们帮你试了试
为了求证文心一言引用的数据是否准确,我们也用百度搜索了今天北京市的气温情况。唯一不够全面的点在于,7 月 6 日北京市气象台发布了高温红色预警信号,北京市部分地区最高气温可达 40℃以上。
第二个插件是「ChatFile」,可基于长文档进行问答和摘要。
比如,机器之心某天有一篇新的论文要读,字数很多,方法很前沿,这时文心一言就能助一臂之力:
文心大模型升级3.5版本,有多强?我们帮你试了试
文心大模型升级3.5版本,有多强?我们帮你试了试
目前,使用 ChatFile 插件的前提是文件基于 PDF 或 Doc 格式,暂不支持扫描件,大小需要在 10MB 之内。
王海峰表示:「插件机制的引入,将进一步扩展大模型能力的边界,也是构建大模型生态过程中非常重要的机制。」下一阶段,文心一言将发布更多优质的百度官方和第三方插件,让用户能够更好地应用文心大模型。同时,文心一言也将逐步开放插件生态给第三方开发者,帮助开发者基于文心大模型打造自己的应用。
    © 版权声明

    相关文章