阿里大模型来了!为啥叫 “通义千问” 它自己回答了

AI应用信息2年前 (2023)更新 10小时前
1.7K 0

潮新闻 记者 祝梅

阿里大模型来了!为啥叫 “通义千问” 它自己回答了

盛传的阿里大模型有新消息!

4月7日,阿里云宣布自研大模型通义千问”开始邀请用户测试体验。现阶段该模型主要定向邀请企业用户进行体验测试,用户可通过官网申请(tongyi.aliyun.com),符合条件的用户可参与体验。

据悉,阿里达摩院在NLP自然语言处理等前沿科研领域早已布局多年,并于2019年启动大模型研发。

阿里云方面表示,此次仅为产品企业邀测。目前尚未正式发布。而据此前消息,阿里云将于4月11日北京峰会现场宣布更多进展。

为什么叫“通义千问”?目前阿里云方面尚未给出官方解释。但记者已经拿到了内测邀请码,这个问题,我们邀请小千问自己回答了一下:

“通义千问”这个名字来源于两个方面,“通义”意味着该模型具有广泛的知识和普适性,可以理解和回答各种领域的问题。作为一个大型预训练语言模型,“通义千问”在训练过程中学习了大量的文本数据,从而具备了跨领域的知识和语言理解能力。

“千问”代表了模型可以回答各种问题,包括常见的、复杂的甚至是少见的问题。它表达了通义千问致力于满足用户在不同场景下的需求,无论问题多么复杂或者独特。综合起来,“通义千问”这个名字表达了这款人工智能语言模型的强大功能和广泛适用性。

而众所周知的是,当chatGPT掀起一次次风波,国内最先宣布进展并公开产品的是百度。会害怕和文心一言对比吗?显然,小千问已有所准备,而文心一言还稍微“傲娇”一点。

阿里大模型来了!为啥叫 “通义千问” 它自己回答了
阿里大模型来了!为啥叫 “通义千问” 它自己回答了

作为最早投入预训练语言模型研究的团队之一,达摩院研发了阿里通义AliceMind,该体系涵盖预训练模型、多语言预训练模型、超大中文预训练模型等,具备阅读理解、机器翻译、对话问答、文档处理等多种能力。

2022年11月,在中文语言理解领域权威榜单CLUE中,阿里AI以86.685的总分成绩创造了新纪录,这是该榜单诞生近三年以来,AI首次超越人类成绩(86.678)。

两年前,达摩院曾公布多模态大模型M6最新进展:其参数已从万亿升级至10万亿,成为全球最大的AI预训练模型。与传统AI相比,大模型的“神经元”数量级更甚,认知和创造能力也更强。

而在几天前,脱口秀演员鸟鸟在微博展示了自己的“分身”。这个分身为阿里训练出的类ChatGPT语音助手,能够模仿她的音色、语气以及文本风格。

而据此前报道,其研究的特点主要为:1.如何让大模型为个人终端、家庭场景等安全高效的服务;2.AIGC生成式AI)以多模态驱动,包括文本、因像、语音、视频

最近杭州屡因美食荒漠上热搜。这个问题,我们也问了问通义千问和文心一言——

阿里大模型来了!为啥叫 “通义千问” 它自己回答了
阿里大模型来了!为啥叫 “通义千问” 它自己回答了

此前,阿里巴巴集团董事会主席兼首席执行官张勇在财报会上表示,云计算人工智能的结合正处于技术突破和发展的关键时期,阿里巴巴将全力构建好自己的AI预训练大模型,并为市场上风起云涌的模型和应用提供好算力支撑。

而马云和王坚,近期都谈及过ChatGPT相关观点。如今,阿里的AI大模型领域的研究成果终于亮相。“通义千问”有何特点,何时面向个人开放?记者将持续追踪。

    © 版权声明

    相关文章