阿里大模型来了！为啥叫 “通义千问” 它自己回答了

1.7K 0 9

潮新闻记者祝梅

盛传的阿里大模型有新消息！

4月7日，阿里云宣布自研大模型“通义千问”开始邀请用户测试体验。现阶段该模型主要定向邀请企业用户进行体验测试，用户可通过官网申请（tongyi.aliyun.com），符合条件的用户可参与体验。

据悉，阿里达摩院在NLP 自然语言处理等前沿科研领域早已布局多年，并于2019年启动大模型研发。

阿里云方面表示，此次仅为产品企业邀测。目前尚未正式发布。而据此前消息，阿里云将于4月11日北京峰会现场宣布更多进展。

为什么叫“通义千问”？目前阿里云方面尚未给出官方解释。但记者已经拿到了内测邀请码，这个问题，我们邀请小千问自己回答了一下：

“通义千问”这个名字来源于两个方面，“通义”意味着该模型具有广泛的知识和普适性，可以理解和回答各种领域的问题。作为一个大型预训练语言模型，“通义千问”在训练过程中学习了大量的文本数据，从而具备了跨领域的知识和语言理解能力。

“千问”代表了模型可以回答各种问题，包括常见的、复杂的甚至是少见的问题。它表达了通义千问致力于满足用户在不同场景下的需求，无论问题多么复杂或者独特。综合起来，“通义千问”这个名字表达了这款人工智能语言模型的强大功能和广泛适用性。

而众所周知的是，当chatGPT掀起一次次风波，国内最先宣布进展并公开产品的是百度。会害怕和文心一言对比吗？显然，小千问已有所准备，而文心一言还稍微“傲娇”一点。

作为最早投入预训练语言模型研究的团队之一，达摩院研发了阿里通义AliceMind，该体系涵盖预训练模型、多语言预训练模型、超大中文预训练模型等，具备阅读理解、机器翻译、对话问答、文档处理等多种能力。

2022年11月，在中文语言理解领域权威榜单CLUE中，阿里AI以86.685的总分成绩创造了新纪录，这是该榜单诞生近三年以来，AI首次超越人类成绩（86.678）。

两年前，达摩院曾公布多模态大模型M6最新进展：其参数已从万亿升级至10万亿，成为全球最大的AI预训练模型。与传统AI相比，大模型的“神经元”数量级更甚，认知和创造能力也更强。

而在几天前，脱口秀演员鸟鸟在微博展示了自己的“分身”。这个分身为阿里训练出的类ChatGPT语音助手，能够模仿她的音色、语气以及文本风格。

而据此前报道，其研究的特点主要为：1.如何让大模型为个人终端、家庭场景等安全高效的服务；2.AIGC （生成式AI）以多模态驱动，包括文本、因像、语音、视频。

最近杭州屡因美食荒漠上热搜。这个问题，我们也问了问通义千问和文心一言——

此前，阿里巴巴集团董事会主席兼首席执行官张勇在财报会上表示，云计算和人工智能的结合正处于技术突破和发展的关键时期，阿里巴巴将全力构建好自己的AI预训练大模型，并为市场上风起云涌的模型和应用提供好算力支撑。

而马云和王坚，近期都谈及过chatGPT相关观点。如今，阿里的AI大模型领域的研究成果终于亮相。“通义千问”有何特点，何时面向个人开放？记者将持续追踪。

本文转载自互联网、仅供学习交流，内容版权归原作者所有，如涉作品、版权或其它疑问请联系AIGC工具导航或点击删除。