人文学界对AI诗歌的讨论,往往围绕“AI能否写诗”展开。其实,这个问题不难回答。首先,如果将诗定义为真情实感的抒发,那么当前的AI确实无法写诗。因为真情实感意味着拥有心智,这样的“强人工智能”迄今尚未出现。不过,即便出现“强人工智能”,写的未必就是人类可理解的诗。因为“强人工智能”和人类是完全不同的智能体,它甚至可能没有个体意识。就当下的AI而言,其存在形式是整体而非群体——根据冯诺依曼结构,存储器将参数分配给芯片进行运算,然后接收返还的结果。不同的AI之间算法机制不同,如果它们都能写诗,其间的差别将远远大于人类世界中不同语言的诗歌。
那么,AI能不能写诗?答案是肯定的。AI完全有可能写出以假乱真的诗。事实上,AI诗歌比其创作的日常语言更容易通过图灵测试(测试是否为人类的语言)。因为后者必须考虑现实经验,在拟真度上有很高的要求。AI没有身体,无法掌握人类的动作顺序,在叙述时难免露出破绽,“具身认知”仍然是AI自然语言面临的难题。诗歌可以回避这一点,因为诗歌是一种特殊的文体,其目的主要在于审美而非实用。它可以采用片断化、陌生化的笔法,像“翠萍湿空梁,夜深飞去。雁起青天,数行书似旧藏处”“让她坐到镜中常坐的地方望着窗外,只要想起一生中后悔的事,梅花便落满了南山”这样的经典诗句,我们就很难用日常的线性时间和因果逻辑去理解,而这样的创作特点恰恰消解了AI面临的障碍。
摆在我们面前的挑战是,如何提高AI诗歌的质量?2018年以来,预训练语言模型BERT和GPT基于Transformer算法取得重大突破。简单来说,其原理是将自然语言转化为向量,根据词语之间发生关系的概率,模仿资料库中的文本。这里就有文本细化的问题。如果文本数量过于庞大,比如以全唐诗为资料库,其中包含了大量相异甚至冲突的风格,AI在学习过程中被不同方向的多力拉扯,写出的诗歌就会平庸驳杂——用文论术语来说就是“缺乏面目”。
要克服这一点,需要对AI进行风格化训练。开发者应通晓诗歌,精心挑选风格相似的诗作为AI学习的素材。仅仅根据时代划分是不够的,诚如钱钟书所说,“唐诗、宋诗,亦非仅朝代之别,乃体格性分之殊”,唐人中有开宋调者,宋人中也有承唐音者,开发者需要更加细致的甄别。以目前市面上一个旧体诗AI为例,开发者用晚清盛行的“同光体”进行专项训练,取得了不俗的效果。如以诗人陈三立《夜舟泊吴城》中首句“夜气冥冥白”生成的三首五律诗:
夜气冥冥白,灯光的的红。旅愁缘酒破,归梦为诗穷。路断人行少,川寒鹭语空。苦吟兼怨泣,剖血答天公。
夜气冥冥白,寒云冉冉轻。老怀犹薄醉,暗月已深更。违俗书常卷,怀人梦不成。萧条吟瘦影,起帐觉秋生。
夜气冥冥白,斜阳黯黯红。城衔山落照,树出水生风。芳草王孙外,孤舟客思中。行吟不能寐,烧烛旋书空。
在这些诗中,除少数地方生造词语(“剖血答天公”)、违背日常经验(“夜”后接以“斜阳”),三首诗总体上看来意境丰富,“旅愁缘酒破,归梦为诗穷”“老怀犹薄醉,暗月已深更”等还颇为惊艳。对比陈三立的原作——“夜气冥冥白,烟丝窈窈青。孤篷寒上月,微浪稳移星。灯火喧渔港,沧桑换独醒。犹怀中兴略,听角望湖亭”,这些诗与其已非常接近,充分显示了风格训练的成效。
诗歌创作向来是“在心为志,发言为诗”,那么,ai写诗对人类究竟有什么意义?
通常意义上的辅助功能,AI已进化至较为成熟的阶段。上述提到的AI大模型,已验证“明七子学唐”“同光体学宋”等结论。这意味着以往被认为抽象的文学风格,可以转化为具体的数据参数。更重要的是,对于诗来说,词语的重组往往会生成意想不到的结果,也许AI生成的一些句子,能够激发诗人的创作灵感,甚至成为诗歌发展中的吉光片羽。早在AI出现前,就有打破人类意图限制创作诗歌的尝试。20世纪初,巴黎的超现实主义者设计过一个名为“精致的尸体”的游戏。参与者在互不知晓的情况下,依据词性随意写下词语,最后组合成句。他们通过这个方法得到的第一个句子是“精致的尸体会喝下新的葡萄酒”(Le cadaVRe exquis boira le vin nouveau),“Le cadavre”在法语中有“喝空的酒瓶”之意,一语双关,颇为巧妙。
事实上,诗歌本身就蕴含着超越人类经验的倾向。俄国语言学家罗曼·雅各布森认为,所谓“诗性”,意味着词语指向自身而非现实。德国诗评家胡戈·弗里德里希认为,诗歌“逃脱人类的中庸状态,背离惯常的物象与俗常的情感,放弃受限定的可理解性,代之以多义性的暗示,以期让诗歌成为一种独立自主、指向自我的构成物,这种构成物的内容只有赖于其语言、其无所拘束的幻想力或者其非现实的梦幻游戏,而不依赖于对世界的某种摹写、对感情的某种表达。”凡此种种,反而契合AI写作的特性。从这个维度上说,未来AI有可能开拓出新的诗歌类型和风格。