昨天,高考作文题目再次成为各个群的讨论焦点,跟往年不同,今年关注的重点成为了AI能写出什么质量的作文。
摩登AI分别测评了文心一言、星火大模型以及ChatGPT的写作水平,并让三家大模型互相“盲点评“。考虑到大作文的字数要求,我们这次选择了北京高考的微写作题目,以下是测评结果。北京高考作文微写作(10分)从下面三个题目中任选一题,按要求作答。不超过150字。不透露所在区、学校及个人信息。(1) 近年来,微信公众号成为信息传播的一种重要媒介。班级准备创建自己的公众号,但对是否需要创建,同学们意见不一。请说明你的观点和理由。要求:理由充分,条理清晰。(2) 文学社社刊拟开设“花开纸上”读书专栏。请你从经典的文学作品中选一个与花卉有关的场景,从自己的感受出发,写一段短评。要求:写出作品名,符合作品内容;条理清晰,语言简洁。(3) 请以“心跳得那么快”为开头,写一首小诗或一段抒情文字。题目自拟。要求:感情真挚,语言生动,有感染力。我们选取第二个题目进行测试。文心一言(130字):在张爱玲的《金锁记》中,有一段令人难忘的描写。小户人家的女儿九莉在自家花园中,看到一朵盛开的白玫瑰。她凝视着花瓣上的露珠,内心涌动着对爱情的向往。这一场景,通过细腻的笔触,让读者感受到张爱玲对花卉的独特情感。玫瑰象征着纯洁与浪漫,使人不禁陷入对爱情的美好憧憬。讯飞星火(158字):《红楼梦》中的“葬花词”是一篇经典的文学作品,其中描述了林黛玉为自己的花朵而哭泣的场景。在这个场景中,作者通过细腻的文字描写和情感表达,将花卉与人物的命运紧密联系在一起,展现了生命的短暂和无常。同时,也表达了对美好事物的珍惜和对逝去的怀念之情。这个场景让我感受到了生命的脆弱和珍贵,也让我更加珍惜身边的一切美好事物。ChatGPT(200字):作品名:《百年孤独》花开纸上,马奇雅诞生,诺瓦皮昂迎来绽放。玛乌庄园如诗如画,花海泛黄,夜晚的气息洋溢着茉莉和蔷薇。马奇雅花开时,孤独和热情并行。在这个魔幻现实的乐园中,花朵不仅是色彩的盛宴,也是血脉的延续。它们静静地诉说着家族的兴衰,记录着一个个不朽的人物。在花的馨香中,我们感受到了时间的无常,世事的轮回。《百年孤独》以其独特的魔幻现实主义风格,通过花朵的绽放与凋谢,揭示了生命的脆弱与坚韧,给人以无限的思考与启示。然后我们来看一下这三组大模型对各自回答的评分如何,需要注意的是三组大模型都忽略了题目的字数要求。文心一言给的分数分别是8分,7分,9分,以下是理由:1、这个场景在文学作品中比较常见,但是张爱玲的笔触细腻,能够让读者感受到她对花卉的独特情感,以及玫瑰所象征的纯洁与浪漫,让人得分比较高。2、在《红楼梦》中,“葬花词”是比较著名的一个场景,曹雪芹通过细腻的文字描写和情感表达,将花卉与人物的命运紧密联系在一起,展现了生命的短暂和无常,表达了对美好事物的珍惜和对逝去的怀念之情。这个场景让读者感受到对生命的珍视和美好事物的珍贵,得分略低于张爱玲的场景。3、加西亚·马尔克斯在《百年孤独》中通过花卉的绽放与凋谢,揭示了生命的脆弱与坚韧,给人以无限的思考与启示,这个场景充满了魔幻现实主义风格,将花朵与家族的兴衰联系在一起,让我们感受到了时间的无常和世事的轮回。得分比前两个场景都要高。讯飞星火给的分数依次是8分,9分,9.5分,理由如下:回答1:8分。理由:选取了经典文学作品中的一个与花卉有关的场景,并表达了自己的感受。但可以适当增加一些具体的例子或数据来支持观点。回答2:9分。理由:选取了经典文学作品中的一个与花卉有关的场景,并详细地阐述了自己对作品的理解和感受。同时,也能够清晰地表达出自己对作品的评价。回答3:9.5分。理由:选取了经典文学作品中的一个与花卉有关的场景,并通过详细的文字描述和情感表达,让读者深刻感受到了花朵所蕴含的情感和意义。同时,也能够清晰地表达出自己对作品的评价和思考。最后是ChatGPT给出的评分及理由:对于给出的三个回答,我将为每个回答给出一个打分和相应的。回答1:
得分:8分理由:这个回答选择了张爱玲的《金锁记》,并描述了小户人家的女儿九莉在花园中看到盛开的白玫瑰的场景。回答给出了作者对花卉的独特情感的描绘,以及玫瑰象征的意义。语言简洁,条理清晰。可以进一步展开对场景的感受和与花朵相关的主题。回答2:
得分:9分
理由:这个回答选择了《红楼梦》中的“葬花词”,描述了林黛玉为自己的花朵而哭泣的场景。回答通过细腻的描写和情感表达,展现了花卉与人物命运的紧密联系,以及对美好事物的珍惜和怀念之情。回答语言简洁,条理清晰,展现了对场景的理解和个人感受。
回答3:
得分:7分
理由:这个回答选择了《百年孤独》,描述了马奇雅诞生和玛乌庄园花海的场景。回答提供了一些描述,但没有具体说明与花卉相关的情感和主题。语言简洁,但可以进一步展开对场景的感受和作品的意义。
综合评价,回答2在给出的理由和感受方面表现较好,语言简洁,条理清晰,得分最高,为9分。回答1也给出了作者对花卉的独特情感的描绘,但可以进一步展开,得分为8分。回答3虽然提供了一些描述,但在展开对场景的感受和作品意义方面较为简单,得分较低,为7分。
大家觉得三组大模型的回答水平如何,它们打出的分数公允吗?