人工智能的热浪一阵接一阵,刚刚过去的2024年WAIC更是为其推波助澜。身处如此汹涌的科技浪潮中,不少企业摩拳擦掌,只为增加一张“AI名片”,趣丸科技也是如此。
除了移动互联网、兴趣社交以外,公司正在蓄力向人工智能领域布局,并实现对其已有业务的赋能。对于本届WAIC中的热议话题——“大模型落地千行百业”,趣丸科技正在用“数智人”交出答卷。
“数智人”先行 切入千行百业
大模型赛道的比拼已进入白热化的第二阶段,即谁先落地具体的应用场景。相关厂商竞相将大模型与数智人、智能体、人形机器人等结合,推出能与细分场景和业务结合的产品与方案。
趣丸科技副总裁兼人工智能研究中心主任张顺四介绍:“目前公司已构建了全栈式AI交互技术产业生态,相关技术并非只是应用在自己的工具或产品上,而是通过链接其他的行业伙伴及应用场景,赋能千行百业。”
具体来说,趣丸科技聚焦细分领域,围绕生成式3D大模型、生成式动作大模型、生成式语音大模型、对话大模型等技术进行研究及规模化落地,拥有ai音乐产品唱鸭App、三维生成平台、一站式数智人应用解决方案等。
值得注意的是,趣丸科技重点发力的数智人业务,已在多领域实现实际应用。张顺四表示:“从直播间到电信营业厅、广交会等线下场景,都有我们的数智人应用。其中,直播数智人,已经应用在多个电商直播间赋能大批中小商家。”
据悉,在第135届广交会展馆中,趣丸科技数智人以多国语言对话为往来的客商提供咨询服务。此外,在与中国电信营业厅的合作中,趣丸科技为其打造了数智人“小信”。张顺四介绍道:“小信”可通过实时语音对话,智能引导用户完成一站式业务咨询及服务办理,并且可以多终端互联操作。另外,“小信”融合了实时智能识别、智能对话、智能感知、智能生成等多项核心技术,让数智人富有拟人化、情感化。
放眼数智人市场,其在教育、政务、影视和银行等多场景均有较大应用空间。据艾媒咨询数据显示,2023年中国数智人带动的产业市场规模和核心市场规模分别为3334.7亿元和205.2亿元,预计2025年分别达到6402.7亿元和480.6亿元。
AI业务“土壤”深厚 赋能已有业务
在向外拓展之余,趣丸科技还利用人工智能技术,赋能其已有业务。比如,其自研的一站式音乐创作全流程AI工具,已经应用在了公司旗下的唱鸭APP上,而唱鸭APP此前入选了文旅部“2022年文化和旅游数字化创新实践十佳案例”,是华南地区唯一入选的项目。
据了解,前述工具是国内首个一站式音乐创作全流程AI工具,集成音频处理技术、深度学习及大数据分析等领先技术,支持AI辅助作词,自动作曲、编曲、混音等。能够全方位解决用户音乐创作全流程难题,让普通音乐爱好者实现零门槛音乐创作。
那么,作为一家常年深耕兴趣社交和电子竞技企业,趣丸科技何以入局人工智能?事实上,从公司原有的业务布局和产品中不难发现。趣丸科技的兴趣社交产品TT语音,累计注册的用户量已超过2亿,公司在音频处理上有长期的技术积累。
张顺四透露:“在音频大模型方面,正围绕跨语种、多方言的语音克隆和翻译技术进行研究,生成高自然度、具备更丰富情感和语气的可编辑音频。”
趣丸科技又是何时开始进行布局的?据悉,趣丸科技近几年重点发力人工智能领域,并开始了一系列创新尝试,对外挖掘资源,与香港科技大学(广州)、香港中文大学(深圳)等顶尖学府共建人工智能联合实验室。
聚焦垂类赛道 实现精准匹配
人工智能落地之路道阻且长,而实现商业闭环,则是关键所在。张顺四说道:“人工智能的研发周期长,投入成本较高,另一方面,商业化落地也需要时间磨合,这是目前发展过程中面临的卡点。”
一个市场共识是,提高大模型与企业需求场景的匹配度,是重要的破局之道。
据人民网研究院组织发布的《中国移动互联网发展报告(2024)》(下文简称《报告》),目前行业中的多模态大模型,对企业内部信息可能“一无所知”,与企业应用场景存在着较大的差距,而与企业基于实际应用开发的小模型相比,大模型与企业实际的需求场景匹配度相差甚远。
对于这样的“病灶”,前述《报告》亦给出了“解药”,称大模型需要先接入企业内部知识库,通过学习、训练、微调等方式适配业务场景,才能进一步推动大模型在企业的应用落地。
对此,趣丸科技方面表示,将会着重解决行业应用的匹配度,同时通过落地场景去链接产业上下游形成生态圈,推动技术规模化应用。
“基于自身优势,我们将专注于垂直领域的大模型,针对行业痛点,开发适用于商业化场景的解决方案,以此推动行业进步与价值提升。”张顺四坦言。
大模型卷落地,除了要有足够的行业Know-how,更要具备软硬件高度集成和协调能力。展望大模型行业的未来,张顺四认为,“软硬一体化结合”将是趋势,也就是说技术通过硬件和产品的承载应用到各个领域,从技术应用上升到产业应用,才能真正体现它的先进性为产业提质增效。