AI时代百家争鸣
自从GPT开年炸场之后
百度的文心开了第一炮
虽然褒贬不一
但目前个人使用情况
文心一格的美术制作还是有亮点的
然后比较出彩的产品
主要是讯飞星火
在问答方面,已经非常接近GPT了
讯飞的核心优势是语音领域
厚积薄发
今天主要想讲讲阿里的通义
目前有两个产品
千问和听悟

其中,通义千问是邀请制
需要以企业名义申请
很多小伙伴无从下手
那么我们重点讲讲:通义听悟
普通人就可以无门槛申请
什么是通义听悟
这个产品有点类似科大讯飞的 “讯飞听见” 系列
我们往往会遇到这样的场景
和甲乙方开会,和上下游开会,各种内部会议
总有个苦逼的小伙伴
担当会议记录员
会后要将纪要整理群发确认等等繁琐的工作
这种工作不亚于给外国影视作品增加字幕的难度
让我们来看看通义听悟
主打会议、访谈、学习等大量对话的场景
实现
输入:音视频
输出:文字
如果是简单的转换,那就和科大讯飞的产品相似度极高
听悟主打的功能是AI辅助
包括
-
同步翻译,目前支持中、英、粤 -
区分不同的发言人,形成对话记录 -
提炼文字概要,总结中心思想 -
提取关键词,待办任务
AI发展到这一步
我感觉翻译、书记员又要失业了
按官方说法
1小时的音视频
转换只要5分钟
试用
首先进入官网首页
点击右上角注册
目前是试运行阶段
直接注册后,会获得2小时的免费时长
以及2G存储空间
接下来,请准备一段录音或视频
比如选取一小段《百年孤独》的朗诵

上传视频文件
这里支持识别的方式包括
中文、英文、粤语、中英混合
不翻译、英语翻译
不区分人、双人、多人等
点击“开始转写”

会先上传到阿里云的空间,然后进行转换
由于我这次的素材比较简单
很快就转换完成了
看看效果
点击左侧“我的记录”
找到转换的文件

可以看到转换的文本都出来了
只有一个小小的错误
上校的名字翻译错了

这次实验的文章比较短
如果有比较长的记录
就能看到更全面的效果
例如章节归纳、发言总结等等
对于学生来说
还可以对老师的教学课题内容进行自动总结
快速形成笔记