过去我是飞书妙记的重度用户,现在我几乎完全放弃它。
只是因为新产品的出现:通义听悟!
它将语音转文字的操作一键完成,转换准确率大幅提升,支持多种导出格式,更重要的是还具备强大的AI分析能力,实现智能提炼、总结等功能。
想象一下,复杂的工作可以被简化,重复的劳动可以被自动化,难以获取的价值可以被发掘。
下面让我带你一起,重新感受AI的力量:)
Take Away:
通义听悟如何利用AI能力,改善语音转文字的使用体验? 通义听悟相较其他产品的独特优势在哪里? 它的产品演化路径是怎样的? 它的产品主体框架是什么? 通义听悟可能的商业模式和发展前景? 通义听悟产品迭代的几点建议
01 通义听悟Super已经重度使用了!
给大家看我的界面:
很多音频文件我都是用通义听悟来处理,有哪些场景会用到呢?给大家说说几个典型的例子啊:
第一.听播客
我们现在时间有限,很多优秀的播客内容又想听,那怎么办呢?可以使用下面的方法来把音频文件导出来,丢给通义听悟,转成文字版本,还带有总结呢,方便多了:
将小宇宙的单集节目分享到微信里 再用电脑浏览器打开单集节目的链接 在播放按钮上右键,选择检查 在右侧的源代码界面,找到Audio Src=“xxx” 双击复制,打开一个新窗口,粘贴后打开该链接 在播放器下面的三个小点按钮那点击一下,选择下载 把这个mp3丢给通义听悟,几分钟,就可以开始看文字了。
第二.前采总结
我做访谈节目,有些会有个前采环节,相当于预先的采访,这里会产生2-3小时的对话内容,我习惯说把过程录音下来,然后回来丢给通义听悟,基于转文字之后,来做提炼总结。
甚至更进一步,我会把访谈内容导出成word,丢给Claude,请它来总结嘉宾的成长经历:
以及给出对应的访谈提纲:
这样能非常快速地帮助我们提炼内容,并且我们可以根据最后的内容做调整和修改。
有关我是如何用Claude来提高效率的,大家可以等我下一篇文章。
第三. 视频&播客剪辑配合
因为每一期播客音频的时长会在2个小时以上,需要剪辑成40-50分钟的内容,就需要对着文字来做删减,我会先把视频里面的音频提取出来,丢给通义听悟,然后对着里面的文字做标注,方便回头用Audition来做删减:
文字上标注蓝色的,是我会保留的内容,其他的会删掉。
这样在Audition操作的时候,就可以对照着看,快速的找到时间点做处理了。
第四. 播客高亮和Shownotes提取
我做播客,习惯把一些精彩的对话片段放在音频一开头,吸引到听众。
怎么做呢?
通义听悟有一个功能叫实验室,里面会提取出一些值得关注的内容,根据我的几次测试,里面推荐的文字,不少确实是整段对话中的精彩片段!这就很省事了!
除此之外呢,通义听悟还有章节速览的功能,对于辅助我做好Shownotes颇有帮助,可以借助来快速找到对应的内容段落: