「序列猴子」语音大模型以出门问问自研并完成备案的「序列猴子」大模型为基座模型,采用第六代TTS引擎 MeetVoice Pro以及语音合成标记语言(SSML)技术进行开发。「序列猴子」语音为通用大模型,提供多种文本和语音应用功能。
其中,文字转语音功能可以将文字快速转换成自然、流畅的语音,可用于制作有声书、语音广告或自动播报;声音克隆功能可以对语音样本的深度学习训练,产生极富自然感和表现力的合成声音;发音校正则是对于发音不准或多音字提供了校正功能,确保语音合成的准确性;智能文案创作可以为用户提供多种风格的改写建议,帮助用户更高效地创作文案。
「序列猴子」语音大模型为AI在声音方面的探索提供了更多的可能性,出门问问旗下的「魔音工坊」(海外版 DupDub)就是其重要应用之一。「魔音工坊」是一款集文案、配音、剪辑全流程一站式 AI 软件,在海内外拥有超过800万注册会员,付费会员超60万。其具有六大核心功能,即软件配音、文字转语音、真人配音、声音商店、效率工具、声音克隆及视频编辑,并拥有有声音克隆、声音搜索、情感合成 / 角色迁移以及声音合成四方面声音黑科技。依托序列猴子大模型,「魔音工坊」可通过 3-10 秒的短音频,快速地实现声音克隆,并支持跨语言迁移、情感语气生成。其海外版 DupDub 还支持多语言生成,目前已涵盖英语、法语、日语、西班牙语、 葡萄牙语、泰语等。
作为业内稀缺的坚持「产模结合」的公司,出门问问声音大模型与「魔音工坊」的配合典型地体现了「产模结合」数据飞轮效应。一方面「魔音工坊」自身的用户数据昼夜不息地反哺着声音大模型的训练,另一方面,声音大模型让「魔音工坊」不断自我突破,有着“超写实”自然音色的惊艳表现,吸引着全球数以百万计的用户深度玩转。
以「魔音工坊」新华社的合作为例,新华社将ai配音加入到新媒体AIGC创新平台后,分别用磁性播音腔、温柔女声、治愈童声等不同类型的声音为推文配上情绪匹配、朗读准确的音频。从文本导入到AI配音成本,通常只要几分钟,大幅缩短了文本配音时间,为新华社工作人员释放更多工作精力。
新华社还可以通过形象克隆和声音克隆技术,为记者或者主持人1:1克隆形象,极大的提升后续拍摄和剪辑的效率。在新华社客户端“问证”板块中,便新增了“数字记者”角色。根据真人记者形象,出门问问为其1:1克隆出了数字记者,并通过短视频形式出镜,随时随地为读者科普播报,报道新闻事件。
出门问问以「Make agi Accessible and AI CoPilot everywhere」为愿景,致力于打造国际领先的通用大模型,通过AI技术、产品及商业化三位一体发展,成为全球AI CoPilot的引领者。
出门问问拥有行业领先的AI基础设施能力、前沿通用大模型「序列猴子」,以及丰富的垂直领域软硬结合的优化算法技术模块,是为数不多的同时服务于内容创作者、企业、消费者三大类不同群体的公司。
面向内容创作者用户,出门问问致力于通过AIGC赋能内容创作,目前已构建丰富的AIGC CoPilot产品矩阵,包括AI配音助理「魔音工坊」及海外版「DupDub」、AI数字分身「奇妙元」及海外版「LivGen」、企业AI交互式数字员工生成平台「奇妙问」、可一键成片的AI短视频生成平台「元创岛」等,打造一站式内容创作平台,赋能创作者实现高效内容生成。
在应用和大模型的垂直整合下,出门问问形成了独特的AIGC商业模式。相较于传统的ToB和ToC,AIGC公司可以形成独特的新商业模式——服务SMB或Professional Consumer(ToSMB/ToPC)。这样的商业模式既可以避免传统ToB的项目制,也可以避免跟ToC互联网巨头竞争停止增长的流量。
在「产模结合」战略和ToSMB/ToPC商业模式的指引下,截至目前,出门问问的AIGC产品累计服务的用户数量已超1500万,注册用户数量超1000万,其中付费的用户数量约86.5万,公司已由传统AI项目制模式成功转型可持续增长的AIGC业务模式。
未来,出门问问将继续AIGC应用场景中深耕,借助公司的领先及先发优势,持续探索AIGC的技术与应用边界,为推动我国生成式人工智能的建设与发展贡献力量。
免责声明:此文内容为本网站转载企业资讯,仅代表作者个人观点,与本网无关。所涉内容不构成投资、消费建议,仅供读者参考,并请自行核实相关内容。