三款国产AI考上文科一本线，期待中国人工智能取得更大突破

6月24日，在极客公园最新发布的高考新课标Ⅰ卷大模型评测报告中，GPT-4o以562分排名文科总分第一。国内产品中，字节跳动旗下的豆包拔得头筹，成绩是542.5分。本次大模型高考评测与河南省考卷完全相同，河南高考录取分数线显示，文科本科一批录取分数线为521分，豆包等三款国产AI成功冲上一本线。

人工智能参加高考，其实已经不是什么新鲜事儿。早在2017年，一款名为“AI-MATHS”的高考机器人，就在全封闭环境中、有监考老师和公证员的情况下，和全国文科高考生同场竞技。这位特殊“考生”挑战了北京卷文科数学和全国二卷文科数学，得分为105分和100分，虽然离110分的目标还有差距，但已经碾压了许多患有“数学恐惧症”的考生。

时隔7年，包括GPT-4o、豆包、文心一言4.0、百小应等在内的近十款大模型再度一起同台竞技，三款国产AI成功一举冲上一本线，再度引发舆论热议。

AI参加高考，并不是为了“好玩”。很多经历过高考“洗礼”的过来人，都不无感慨地表示高三是一生中最博学的时候，甚至达到了自己智力水平的巅峰。虽然有些调侃和夸大的色彩，但高考确实在一定程度上“检验”了个体的综合素养。既然名为“人工智能”，能否配得上这个名称，参加高考无疑成了最具说服力的方式之一。

于是，随着人工智能的突破性进展，在围棋、自动驾驶等领域一展身手后，便盯上了挑战高考这个“新赛道”，意在通过高考对学习和知识运用能力检验，一较高下。不出意外，GPT-4o凭借强劲的实力夺得魁首，而国产AI豆包的表现同样可圈可点，不仅超过文科一本线20分，而且还取得历史、化学两项单科第一。

值得一提的是，豆包的作文在匿名阅卷中获得阅卷老师的好评：文章中显出的对就业结构、伦理方面的担心，展现出豆包已经具有不错的思想深度和思辨能力。在立住“问题”后，豆包随即用反问句自然过渡，引出三个排比段提出解决问题的方法——保持“问题意识”。其中用发展的眼光分析问题，结合现实生活揭示问题产生的根源和危害的部分颇为亮点，并且整体上“结构严谨，层层推进，语句流畅，认识全面”。

豆包技术能力之所以明显领先于国内其他大模型，其实并不意外。根据智源研究院 FlagEval 大模型评测平台6月最新榜单，豆包大模型在主观评测和客观评测的综合成绩均排名前二，知识运用和数学能力单项得分排名客观评测第一、主观评测前三。

科学技术是第一生产力。随着数字经济时代的到来，基于人工智能、5G技术、物联网等领域的科技创新，已成为提升国家综合国力和核心竞争力的关键。我们必须看到，技术进步不是一场百米冲刺，而是漫长的长跑。ChatGPT的诞生，就是世界顶尖科学家经年累月研发的结果。十年磨一剑，才有了一朝横空出世的“惊艳”。

生成式对话产品的出现，意味着人类对自身的突破，也为未来科技发展破了题。当下，生成式AI赛道已成未来人工智能化发展的方向，如同多年前的AlphaGo，ChatGPT已经成为人工智能发展史上的一个符号，从这个意义上说，它不可被复制，只能被超越。

科技是国家强盛之基，创新是民族进步之魂。正是基于对科技的高度重视，一年前中共中央、国务院发布了《党和国家机构改革方案》，把科技作为重要内容，备受外界瞩目。与时俱进，才能领先一步。此举体现了中央对科技发展战略性、方向性、全局性重大问题的高度重视，由此释放出来的制度优势、政策红利，也必将极大促进科技领域的创新创造。期待以豆包等为代表的国产AI，能借助这股东风取得更大的突破，让世人“刮目相看”。