网络小说中常出现的穿越、玄幻、求真、修仙桥段都源于什么?9月23日,阅文集团公共事务副总裁王睿霆在南京举办的“2023文化和科技融合热点和趋势论坛”上,带来《数字赋能文化、创造阅读未来》的分享。
阅文集团公共事务副总裁王睿霆
2023文化和科技融合热点和趋势论坛
网络文学的科技变革
做国内第一个网文大模型的见证者
王睿霆分析到,长期以来,网文作家在写作过程中普遍面临着三大痛点:首先是专业知识获取渠道匮乏,特别是在科幻、历史类题材,知识难获取、耗时长、难消化、准确性难以保证。其次创意思路文本化也是一个困局,作家往往要花费大量精力完善细节,然而受限于文笔水平,好创意难表达。最后就是入门指导与专业反馈短缺,新手作家需要听取专业建议来提高过稿率,成熟作家需要获得对作品数据和读者反馈的专业解读,而这些需求并没有针对性的智能化工具支撑。
从业几十年来,王睿霆也见证了网络文学产业在科技变革中发展壮大。从过去在书店买书,到电商时代的图书网购,再到移动互联网时代的“一屏万卷”,数字阅读接触率已经从2008年的24.5%增长到2021年的79.6%。数字经济与文化数字化浪潮,催生了新一轮产业迭代,孕育着全新的战略机遇。
基于此,阅文2023年7月发布国内第一个网文大模型—阅文妙笔大模型,同时也面向作家推出基于大模型的应用产品——作家助手妙笔版。在这个大模型中通过提供灵感、补充细节等方式,帮助作家丰富世界观设定、丰富打斗和景物描写、丰富角色设定,甚至生成角色形象图,每位网文作家可以在科技支撑的世界中有一个配备“专业团队”,这个大模型的出现,
也能够解决网文作家的痛点,同时这也是推动IP产业新变革的第一步。
重塑传统网文生产方式
过去,受到IP开发产能、效率和成本的限制,大量优秀的作品不能获得改编机会。同时,IP在动漫、衍生等不同链条的开发相对割裂,不可避免会出现用户流失和价值折损。对此,AIGC的应用将大大提升IP开发的效率和产能。王睿霆向记者表述:阅文也在全面探索有声、漫画、动画、衍生等开发链条的AI应用。过去网文漫改单格需要2小时左右的上色环节,利用AI已经能缩短到1小时以内;在有声方面,结合AI技术改善文字转有声内容的声音质量;还计划用AI技术优化TTS(Text to Speech)有声的类人声断句、音色,并与影视进行IP联动。
对于未来王睿霆做了这样的畅想:“衍生品能够在故事更新阶段就介入,而无需等待小说完结或者动漫完成改编之后再进行,争取实现IP多形态的同时开发。我们目前已经尝试对一些在更新中的头部网文进行衍生品开发。在AIGC的不断深入下,我们期待网文未来在更新时,就能加速形成有声、漫画、衍生等一体化开发,为我们带来更强的用户粘性、更广泛的用户群体、更高效的价值转化,在系统性提升IP改编成功率的同时,进一步形成对网文作品的反哺。”
“毒树之果”的语料
大模型仍然面临着诸多疑点和挑战
爬虫软件可以在短短几秒内,抓取一本几百万字的小说作品,当这个时间延长为几分钟,就可以爬取成千上万本书籍。但市场上大模型服务主体均未对训练数据的来源、是否获得授权进行披露。
“阅文的大量作品内容因盗版猖獗,极有可能已被用于数据训练。有些企业与我们接洽,希望通过我们获得作品内容的著作权授权后进行大模型训练。然而,因法律性质不明,缺乏明确的交易规则,当前也难以与有意向的企业达成合作。”王睿霆也表达了自己的担忧。
尤其值得注意的是,市场上已进行公测的大模型开发者仅陈述其使用的数据来源于互联网。大量版权内容未获得著作权人同意,也没有告知著作权人其作品将被用于大模型训练,因此从法律意义上讲不属于通过合法来源获得的数据。这种类似于“毒树之果”的语料,其产生的收益如何界定和分配,也面临着诸多疑点和挑战。AI时代的版权保护将是我们需要持续探索的时代课题。
对此王睿霆表示“AI大模型的本质是从文字中提炼出人类知识,再用知识驱动智能。这一特质,决定了对数据尽可能多的占有,是刻在AI大模型基因中的本能。我们认为,在所谓的“通用人工智能时代”到来之前,人工智能的安全风险主要来自于‘人’。正如图灵奖得主、中国科学院院士姚期智说,“我们不应该假设机器是公正的,因为机器可能会试图改变人类的行为。更准确地说,是机器的所有者想要改变其他人的行为。”
“作为行业大模型探索的先行者,我们也在同步推进数据和算法安全合规,在主体安全、信息安全、内容安全等方面守住底线和红线,坚持科技向善和公平透明,防范人工智能数据安全和算法治理风险,携手行业共建网络和数据安全治理生态,让好故事在数字时代生生不息!”
“新创作”时代,AIGC是创作的金手指,而主角永远是作家,在文化数字化战略下,数字阅读前景可期。伴随着产业新一轮提质升级,数字阅读应进一步激活文化资源、数字文化生态,为全民阅读注入新引擎。