讯飞星火V4.0将于6月下旬发布 刘庆峰详解五大战略打赢大模型之战

大皖新闻讯 在日前举办的科大讯飞成立25周年司庆活动上,科大讯飞董事长刘庆峰预告,讯飞星火V4.0将于6月27日发布,将会进一步强化国内的领先地位。日前,随着语音和音视频能力都有所提升的GPT-4o的发布,底座大模型再次迎来智慧升级,对此刘庆峰也表示,站在当前语音和大模型全新的战略机遇交汇处,讯飞星火要通过五大核心战略,来打赢大模型之战。

五大战略打赢大模型之战

刘庆峰详解大模型时代科大讯飞核心战略。

第一,赋能现有的软硬件和行业产品,形成基本盘。背靠科大讯飞的根据地业务,深入教育、医疗、工业、汽车、家电等行业赛道,同时打造基于大模型的翻译机、学习机等王牌硬件产品。

第二,开拓以央国企为代表的重点行业客户市场。按照大模型能力可达程度的三个台阶,提供真正解决行业和企业刚需的方案。

第三,开辟新兴赛道的软硬件一体化授权和新硬件机遇,比如机器人硬件、医疗硬件等。

第四,在万物互联时代,AI助手的入口级战略机遇。以“能听会说”为前端,以“能理解会思考”为后端,将极大推动万物互联时代进程。

第五,推进“讯飞超脑2030”计划,迈向家庭陪伴机器人的万亿市场。

刘庆峰通过多项行业和产品应用,亮出目前大模型成绩单。据了解,目前中国汽车出口的多语种技术,几乎全部由科大讯飞提供。奇瑞、蔚来、广汽、一汽等国产品牌都在和讯飞合作,国际汽车品牌大众在评估后也迅速落地应用,于3月13日发布首款搭载星火大模型的车型“ID.UNYX” 。

刘庆峰表示,大模型应用落地的一个关键是云边端一体化和软硬件一体化,在底座能力和垂直方向上要做透还要做好,用更小的算力做出相对更优效果。“在云侧,我们有很好的大参数的通用模型(各种不同尺寸都有),也有星火一体机、‘飞星一号’算力平台等完全自主可控的硬件支撑;在边、端侧,科大讯飞有在汽车等行业落地的中等参数模型和软硬件一体化方案,也有完全能够在手机等智能终端上安装和使用的‘小’模型和方案。从而形成了云边端一体化和软硬件一体化的综合落地优势。”

“本轮的通用人工智能,从国内外的发展看都是‘大平台加英雄主义’,没有通用大模型的底座能力,没有算法、数据等各方面的积累,就没有办法做出改变世界的大模型应用和产品。所以必须站在大平台之上。”刘庆峰说,从底座能力和承担的国家战略任务看,讯飞星火就是这个大平台,再往后大平台属性还会进一步增强;除此之外,还要有英雄主义,让每个人的创造力真正被激发出来,成为充满想象力、充满战斗力、充满开拓精神的英雄。

讯飞星火V4.0将于6月下旬发布 刘庆峰详解五大战略打赢大模型之战

智能语音应用将迎来全面重构

科大讯飞从语音起家。而OpenAI从通用底座的GPT-4,到有视觉功能的GPT-4V,到语音大模型Whisper、文生视频大模型Sora,再到今年5月份发布的语音和音视频能力都有所提升的GPT-4o,对全球语音市场都带来非常大的推动。

刘庆峰表示,原来的语音合成、语音识别、机器翻译等单点技术,通过大模型的理解能力、文本生成能力在后台加持提升,实现了语义理解、指令跟随、多轮对话、情绪感知、超拟人合成,真正使得语音交互得到提升。

“在这个背景下,语音领域的几乎所有应用都值得用新方式重构一遍,这就是现如今语音产业的全新战略机遇。”刘庆峰说,医疗导诊机器人、酒店服务机器人、所有企业的客服机器人等都可以重新做一遍;7×24小时营业场所的部分岗位、企业中的服务类岗位等都可以用数字员工;汽车、手机、家庭助手等终端的智能语音服务也能得到很大提升。“类似的应用领域非常多,产业空间巨大。”

他分析,GPT-4o对万物互联时代语音浪潮的推动,类似于当年Siri对语音应用的推动。“它备受关注的原因:超拟人合成,使得说话不再是朗读腔调,而是真的像人一样自由对话;全双工交互,可以同时(瞬时)进行信号的双向传输,人机对话可以随时打断和继续;通过语音到语音的端到端建模实现快速反应的极致交互体验。”

刘庆峰说,目前科大讯飞在超拟人合成技术方面,中英文、多语种都做到了国际领先。下一步,科大讯飞将发力远场高噪音多人说话场景、高表现力个性化场景、云边端一体化、软硬件一体化,从技术优势、市场先机、落地成效构建全方位持续领先优势。

讯飞星火V4.0将于6月下旬发布 刘庆峰详解五大战略打赢大模型之战
    © 版权声明

    相关文章

    暂无评论

    暂无评论...