阿里云“通义听悟”正式发布:用户可免费领服务

AI应用信息9个月前发布 XIAOT
185 0
阿里云“通义听悟”正式发布:用户可免费领服务

通义听悟是基于阿里云通义千问大模型开发的AI应用,主要针对音视频内容进行转写、检索、摘要和整理,比如用大模型自动做笔记、整理访谈、提取PPT等。

事实上,通义听悟的前身是阿里云内部一个名为“听悟”的产品,主要功能包括实时会议、音频转写功能,“听悟”自2022年年底就开始小范围内测。

阿里云“通义听悟”正式发布:用户可免费领服务

不同于传统的实时会议速记转写,如今面向C端提供视频转写服务的应用尚在少数。而如今的通义听悟,则从纯粹的音频转写,延伸到了音视频领域,融合了十多项AI新功能。

阿里云智能CTO周靖人表示,听悟集成了阿里最先进的语音和语言技术,比如,阿里新一代工业级语音识别模型——其识别准确率在多个权威中文数据集上名列第一。

在听悟中,用户可以将视频/音频上传,完成录音转写。根据36氪的体验,在音频转写速度上,听悟的处理速度不错——对1-2小时的音频,听悟一般在数分钟内就能转写完毕。

音频转写完毕后,听悟还能够做到中英对照翻译,还能够一键总结会议要点,划分章节、区分不同发言人的观点、整理待办事项等等。

    © 版权声明

    相关文章