“大家好,我是数字人大亨,很荣幸能够与大家探讨一个备受关注的话题:AIGC(AIGC即AI Generated Content,是指利用人工智能技术来生成内容)是否能代替人类进行创作?历史证明,人类的创造力和创作风格是随着时代和技术革新不断演进的。在内容创作,尤其是创作优质个性化内容方面,AIGC和人类的协同是非常必要的一环。”
3月30日,在2023新榜大会上,腾讯内容平台部副总经理姚天恒通过他的数字人“大亨”做了这样的演讲开场。令人关注的是,这个数字人不仅在形象上高度逼真,而且在语音、语调、唇动等方面也非常真实,甚至连姚天恒惯常的表情和动作都毫不马虎地模拟了出来。
腾讯内容平台部副总经理姚天恒和他的数字人“大亨”
据了解,数字人“大亨”是以姚天恒真人为原型打造,采用腾讯智影最新人工智能技术,通过深度学习他本人少量的真实音频、视频数据生成的分身模型。借此机会,腾讯也正式对外发布了全新的AI智能创作助手“腾讯智影”,通过为内容创作者提供一系列的智能创作工具,帮助创作者在内容创作时提质增效。
“在内容创作中,PGC的工业化规模产出和UGC的创意转化一直是困扰创作者的核心难题,但AIGC的发展极大地提升了创作者的生产效率,从而对解决以上难题提供了可行的解决路径。结合AI能力与人类创意,AIGC可以实现全链路闭环的人机协作,包括内容创意、观点确立、素材生成、内容润色和制作等。腾讯智影就是通过提供‘人’‘声’‘影’三个方面的能力,使内容创作更简单高效。”姚天恒介绍。
解放“人”力,腾讯智影让每个人都能实现数字人自由
在“人”的方面,“智影数字人”是腾讯智影最核心的功能。用户只需要输入文本或音频内容,几分钟内即可生成数字人播报视频。腾讯智影目前开放了数十款风格多元的数字人,创作者可根据自己的需求选择数字人形象、服装,添加不同的动作、背景等,让真人出镜的视频制作变得更加简单。
腾讯智影数字人播报
此外,智影数字人还能实现“形象克隆”。类似于文章开头的数字人“大亨”,用户通过上传少量图片、视频素材,就能得到自己的数字人分身,价格亲民操作便捷,让所有人都能实现数字人自由。
腾讯智影还接入了数字人直播,智影数字人可以直接替代真人,不受时间、空间限制,无需搭建任何拍摄场地,使用虚拟背景即可进行播报、访谈、连线、互动等多种操作,实现7*24小时不间断开播。
腾讯智影数字人直播
目前,智影数字人在多个场景里都有应用。不久前,腾讯智影就为人民日报新媒体两会报道数字主播“任小融”提供技术支持,为大家带来了“千人千面”的个性化新闻播报内容;去年疫情期间,腾讯智影还联合上海人民广播电台长三角之声打造了全国首个省级电台数字人主播“长小姣”,助力媒体内容生产和视频化转型的探索。此外,秉承腾讯公司科技向善理念,智影手语数字人还服务冬奥会和王者荣耀KPL比赛,为听障人士进行赛事报道和解说。
绽放“声”机,腾讯智影助力创作者配音变得高效简洁
在声音创作方向AIGC的创新上,姚天恒介绍了智影文本配音、音色定制、智能变声三大功能。
为满足不同创作者的配音需求,腾讯智影文本配音功能提供了上百种音色可供选择,输入文本即可生成自然语音,操作简单便捷,适用于新闻播报、短视频创作、有声小说各种场景。数据显示,一段1000字的文稿,腾讯智影可在2分钟内完成配音和发布,同时能手动调整语音倍速、局部变速、多音字和停顿等效果,还支持多情感和方言播报,让音频听起来更为生动自然。
腾讯智影文本配音
此外,基于腾讯智影的声音识别和复刻技术,创作者可以快速实现音视频内容编辑。首先,腾讯智影能够通过语音识别和文本顺滑能力,实现自动化去除冗余词;在音频改写方面,通过声音克隆和音频训练等技术,可以把原视频中的部分语句进行修改。姚天恒介绍,“这种文本转语音的方式可以减少繁琐的录制流程,在视频创作、热点发稿、著作翻新和后期口误处理等场景下帮助创作者快速、准确地完成大量配音工作,让优质内容更快地触达观众。”
腾讯智影还提供了有趣的变声功能,创作者通过腾讯智影的变声技术,可以在保留原始韵律的情况下,将音频转换为指定人声,帮助创作者解放生产力,让视频更有表现力。在现场演示中,姚天恒以《三体》叶文洁的旁白配音为例,腾讯智影提前复刻了叶文洁的音色,并通过智影的变声技术,将任意人员录制的声音转换成叶文洁音色,听上去非常有感染力。“在面对大量内容生产任务时,创作团队可以一起帮助KOL进行音频演绎;或是在视频处理过程中,某段视频需要进行台词补录、修改,通过这项功能也无需再让演员返工,任意工作人员都可以辅助完成配音的更新。”
让“影”随形, 腾讯智影让智能化视频自动生成成为现实
在视频影像剪辑创作AI方面,姚天恒指出AIGC的文本自动生成视频技术,是一项革命性的技术创新,为视频产业带来了前所未有的机遇和挑战。与传统视频制作方式相比,AIGC技术大幅提升了视频内容的生产效率和质量,同时也为创作者提供了更多的创意空间和自由度。
对于什么样的智能才是对创作者有价值的智能?姚天恒给出了三个关键词:“更懂你”“更精美”“更生动”。
“更懂你”是指一款好的工具必须得精准理解创作者的意图,无论是文本、语音还是手绘草图,都能够被智能工具快速转化为实际的创作成果。“更精美”指的是创作品质的提升,例如好的智能工具通过各种形式的辅助,如一段好句子、一张精美的图片或一个精彩的镜头,来帮助创作者更好地讲述自己的故事。“更生动"则是对内容表达形式的要求,相比图片、文字,视频是更生动的表达形式,好的工具能够帮助创作者生产出更有趣、更生动的内容。
在AIGC技术的加持下,创作者可以通过腾讯智影文章转视频能力,直接将自己撰写的文字转化为视频内容,无需进行繁琐的素材收集和处理;此外,腾讯智影分段式的素材呈现方式,让创作者可以快速处理分镜、添加卡点、滤镜、特效等,从而大大缩短了视频制作的周期和成本。同时,腾讯智影还提供了海量的版权素材,为创作者提供更多的选择和灵感。这使得创作者可以更加专注到创作的策划、创意和营销上,提高内容的质量和传播效果。
腾讯智影文章转视频
“未来腾讯智影会变得更加智能,创作者甚至只需要带着一个想法,就能在智影上创作一段动漫或做一个精彩的视频,让自己的故事更加生动。”对于下一步发展计划,姚天恒表示,腾讯智影将进一步加强对AIGC技术的研究和探索,不断挖掘其潜在的应用价值和可能性,在价格与易用性上降低数字人及声音定制等产品的使用门槛,用AI赋能创作者们,让智能创作如影随形,真正实现让内容多元,让创意绽放。