昆仑万维「天工」大模型开启内测,我们跟它聊了聊理想

AI应用信息10个月前发布 XIAOT
89 0
昆仑万维「天工」大模型开启内测,我们跟它聊了聊理想
国产ChatGPT,能再迎一次惊喜吗?

来源|AI蓝媒汇

ID:lanmeih001

作者|伊柒

编辑|魏晓

“每隔一段时间,就会有一个革命性的产品出现,然后改变一切。”

这是2007年1月9日,乔布斯在一次手机发布会上的开场白。手机名叫iPhone,它改变了通讯、娱乐和移动互联网。之后,iPhone或是和iPhone类似的手机,出现每个人的手中。

2022年11月30日,由OpenAI研发的ChatGPT问世。

在最初的描述中,ChatGPT被称为“聊天机器人程序”,但人们发现这个AI能做的不只是“Chat”——之后的几个月,人们陆陆续续将它接入各种场景:答疑、编程、绘画、翻译、文本创作、广告设计、头脑风暴……然后震惊于AIGC的想象力、创造力和生产效率。从聊天到创作,或许在2023年之后,没有任何一个行业有理由完全排除AIGC

此时此刻,恰如彼时彼刻。

但也有不同——这一次,国内AI行业的跟进远比过去及时。百度、商汤等几位AI课代表很快推出了类似ChatGPT国产AI大模型,外界的质疑声中渐渐听到了掌声。

2023年4月,昆仑万维「天工」3.5大语言模型发布,并启动邀请测试。AI蓝媒汇(ID:lanmeih001)的蓝媒君第一时间对话了「天工」大模型

昆仑万维「天工」大模型开启内测,我们跟它聊了聊理想

对话的内容,都和“理想”有关:

AI大模型没说自己的理想,但它鼓励蓝媒君坚持理想——“记得不要因为挫伤自尊心而放弃。”

昆仑万维的理想——“目前版本我们对标的主要是OpenAI的ChatGPT。未来让它尽快达到GPT-4的能力。”

国产ChatGPT,能再迎一次惊喜吗?

昆仑万维「天工」大模型开启内测,我们跟它聊了聊理想

第一个实现“智能涌现”的国产大模型

在和「天工」大模型的对话中,蓝媒君预设了一个场景:中学老师与学生对话,目的是确定学生的兴趣。

对话过程如下。

昆仑万维「天工」大模型开启内测,我们跟它聊了聊理想

蓝媒君确实曾和体育场里面的小朋友聊过这个问题,当时小朋友的回答是“喜欢跑步”、“觉得好玩”。

昆仑万维「天工」大模型开启内测,我们跟它聊了聊理想

尽管在一开始就预设了问答模式,但「天工」大模型在实际对话中并没有完全遵循“每答必问”的结构——或许是算法判定蓝媒君“喜欢踢足球”这个话题已经讨论充分,可以作为“你的兴趣是什么”的答案。

蓝媒君提出了第二个兴趣,看书。

昆仑万维「天工」大模型开启内测,我们跟它聊了聊理想

从这里可以看出,「天工」大模型依然延续着刚才关于“确定兴趣”的这个话题,并遵循了问答结构。

对话继续,蓝媒君的爱好很多。

昆仑万维「天工」大模型开启内测,我们跟它聊了聊理想

「天工」大模型所给出的反馈始终直白,像是两位小朋友最日常的对话:你喜欢科学,那你会怎么做?

以上文本在成年人看来略显简单,但一问一答确实符合需求——「天工」的回答做到了逻辑通顺、推进沟通。而这种简单通顺,或许正是人们需要的。

昆仑万维「天工」大模型开启内测,我们跟它聊了聊理想昆仑万维「天工」大模型开启内测,我们跟它聊了聊理想昆仑万维「天工」大模型开启内测,我们跟它聊了聊理想昆仑万维「天工」大模型开启内测,我们跟它聊了聊理想昆仑万维「天工」大模型开启内测,我们跟它聊了聊理想昆仑万维「天工」大模型开启内测,我们跟它聊了聊理想

或许整场对话难言十分惊喜,但至少从对话逻辑和内容上,「天工」基本做到了连贯通顺、符合人类逻辑。

在谈到大模型的逻辑推理时,昆仑万维称,「天工」目前的记忆力大约可支持20轮次以上的交互式问答,文本容量也在万字以上。

“在AI领域,进行自主学习并完成逻辑推理等任务的能力,被称为‘涌现’能力。”而根据昆仑万维CEO方汉的介绍,「天工」大模型是目前“国内第一个实现智能涌现”的国产大语言模型。

这是一个在相对简单的系统中,由量变产生质变,最终产生复杂的行为或特性的过程。

而根据官方提供的测试数据,基于千亿基座模型和千亿排序模型,「天工」大模型生成内容已经能够在某知识社区的问答中,获得KOL级的赞同和回应。

但「天工」偶尔也有失误的时候。

在另一份关于数学题的测试中,天宫大模型准确算出了一道鸡兔同笼题目,但却被另一道来自中学数学课本的一元一次方程困住,并最终得出了一个错误的计算结果。

昆仑万维「天工」大模型开启内测,我们跟它聊了聊理想

或许是对题干的理解偏差,或许是方程组相关的数据训练还不够完善,「天工」在运算方面的能力和方法,仍有些改进空间。

谈及大模型训练的工程进度,昆仑万维方面表示,关于数据的筛选、剪枝和清洗是“长期主义”的过程——「天工」大模型将在后续的迭代中,通过筛选数据调整参数改进模型设计。

“问题会有,但正视差距不会影响团队的信心。”

而「天工」大模型,也只是昆仑万维在AIGC赛道内的落脚点之一。

    © 版权声明

    相关文章