大模型卷向下半场：价格战之后如何成为真正“刚需”

2022年年末，聊天机器人 ChatGPT一炮走红后，2023年国内涌现出两百多个大模型，被称为大模型元年，一时间掀起“百模大战”。而从今年5月开始，在几家大型厂商的带领下，大模型价格战愈演愈烈，国内“百模大战”步入新阶段。

6月3日，澎湃新闻正式推出一线财经大调研直播——《超级公司》。首期走进国内一线人工智能公司商汤科技，商汤科技联合创始人、大装置事业群总裁杨帆告诉澎湃新闻记者，各家厂商都是在尽可能多地去获取用户，“大家的一个共识是，两三年之后这一轮大模型应用的用户可能是今天的10倍、100倍。

时间回到半个月前。

5月15日，字节跳动在火山引擎原动力大会上正式发布豆包大模型，被认为是吹响了大厂大模型价格战的号角。随后，阿里、百度、科大讯飞、腾讯纷纷加入降价行列，甚至直接宣布主力模型免费。

据字节方面介绍，豆包主力模型在企业市场的定价只有0.0008元/千Tokens，0.8厘就能处理1500多个汉字，比行业便宜99.3%。根据火山引擎公布的价格计算，一元钱就能买到豆包主力模型的125万Tokens，大约是200万个汉字，相当于三本《三国演义》。

一周后，5月21日，阿里云宣布，通义千问 GPT-4级主力模型Qwen-Long，API输入价格从0.02元/千tokens降至0.0005元/千tokens，直降97%。这意味着，一元可以买200万tokens，相当于五本《新华字典》的文字量。同一天，百度智能云在几小时后宣布，文心大模型两大主力模型全面免费。

5月22日，科大讯飞跟进降价，宣布讯飞星火API能力正式免费开放，讯飞星火Lite API永久免费开放，顶配版（Spark3.5 Max）API价格为0.21元/万Tokens。腾讯云也在当天宣布，混元大模型全面降价，其主力模型之一的混元-lite模型价格从0.008元/千tokens调整为全面免费。

而在更早之前，国内大模型公司智谱AI宣布，个人版/入门版GLM-3 Turbo模型调用价格由5元/百万tokens降为1元/百万tokens，相当于0.001元/千tokens。幻方量化旗下DeepSeek（深度求索）也在发布第二代MoE模型DeepSeek-V2时，称其“性能比肩GPT-4”，并报出每百万token输入1元、输出2元（32K上下文）的低价。

大模型价格战，到底在“打”什么？

免费的只是基础版。科大讯飞就曾在投资者关系活动上表示，讯飞人工智能开放平台面向全行业提供人工智能能力和整体解决方案，以免费+扶持的策略为主，基本能力免费，对于其他企业做不了的、性能更高的、个性化的定制服务收费。

在大模型“开卷”低价的背后，有技术进步的支持、争夺市场的需求，也有更加现实和长期的考量。

百度智能云也有千帆·行业增强版，在大模型服务方面，企业可以在千帆平台上自由选择不同参数规模、不同上下文长度、不同细分领域的大模型，然后按需扩展行业模型、行业知识、行业智能体。不过，百度并未公布千帆·行业增强版的具体价格。

宣布降价后，火山引擎总裁谭待在接受澎湃新闻等媒体采访时，谈到了大模型的定价策略：“背后主要有两个原因：第一点是我们能做到，第二点是我们需要这么做。”他介绍，火山引擎在技术上有非常多优化手段，可以降低大模型成本，在工程上可以通过分布式推理的形式将底层算力使用得更好；另外，在混合调度方面，可以把不同负载作为混合调度，这样的成本也大幅下降。

阿里云相关人士也对澎湃新闻记者表示，能够推出低价大模型“主要靠技术层面”。

据研究机构IDC预计，2026年中国AI市场的规模将达到264.4亿美元，2021年至2026五年复合增长率（CAGR）将超20%。有了技术的支持，在竞争激烈的市场内，厂商开始“卷”起低价。

杨帆向澎湃新闻记者表示，各家厂商都是在尽可能多地去获取用户，“大家的一个共识是，两三年之后这一轮大模型应用的用户可能是今天的10倍、100倍。如果是这样，今天花多少钱去获客都是不亏的，这意味着你占据了先手。所以从这点上来讲，很多C端（客户端）的应用和互联网早期有一定的类似性”。

顺福资本创始人、行行AI董事长李明顺也指出，为了争夺市场占有率，大模型价格战的到来是“必然的”。随着规模效应的展开，“笑到最后的肯定能赚钱，这个就是定价策略的问题”。

此外，有多位业内人士对澎湃新闻记者谈到，价格战也是一种促进AI应用发展、培养行业生态，并为厂商收集数据的手段。

在宣布降价的阿里云武汉AI智领者峰会现场，阿里云智能集团资深副总裁、公共云事业部总裁刘伟光坦言：“阿里云这次大幅降低大模型推理价格，就是希望加速AI应用的爆发。我们预计2024年大模型API的日调用次数有望突破100亿。”

作为基础大模型与用户端之间的“中间厂商”，澜码科技的CEO周健表示，价格战出现的本质原因其实是各大厂商之间在竞争数据，“大模型厂商实际上在烧钱进行大量的投入，有点类似于当年‘百团大战’、滴滴和快的打车竞争的格局。我认为，大模型厂商并没有太考虑定价能否cover（覆盖）成本或带来利润，从大模型厂商的商业策略讲，现在降价的主要目的更多还是收集数据，在投入期，没到能够赚钱的地步。”

周健进一步指出，大模型企业希望能有更多的C端，找到不同的场景，而不再去强调做了多少亿参数的模型、是GPT-4的七成、八成还是九成。

步入新阶段后，大模型如何成为“刚需”

不过，对于价格战是否意味着百模大战已经进入下半场，业内人士有不同的观点。

李明顺认为，价格战意味着大模型进入一个新的局面，但并不是大模型的下半场，“现在仅仅是大模型企业在C端竞争过程中，进入到肉搏阶段。”

作为大模型行业内的初创企业，制作API集合工具包的蓝雨AI联合创始人北山也对澎湃新闻记者表示，这次价格战或许只是一次“比较小的波澜”，对于C端客户来说感受并不强烈。但在资本要素等多种因素的影响下，大模型价格战“可能会一直持续到出现一个垄断式的爆款”。

经历过价格战之后，竞争激烈的大模型赛道究竟会走向何方？

据亿欧智库发布的《2024中国“百模大战”竞争格局分析报告》，通用大模型历经创业爆发期，预计市场将于2025至2026年逐渐出清，优势企业坚守战场，剩余企业陆续退出竞争；2027至2028年，通用大模型市场将呈现寡头竞争格局。垂类赛道则将成为大模型产业激烈竞争的领域，预计在2023至2024年，部分行业场景率先落地；2029年以后初步市场出清，各细分行业呈现碎片化竞争格局，应用层获取的市场价值日趋增长。

目前看来，不管是对企业用户还是对个人用户来说，大模型都尚未成为一种“刚需”，这或许是最需要厂商攻克的一大难题。

北山强调：“这个行业目前遇到的一个最大的卡点，其实不在于成本，而是没有一个大模型或者应用，能够让大部分用户不用不行。”

杨帆也对澎湃新闻记者表示，中国很多的应用还没有被真正激活和打开，“更多的热潮其实是来自媒体、投资圈的关注，90%甚至99%的人，可能都没有真正的日常地去使用体验或者感受到这样的技术。”

杨帆认为，技术的进步只是一个维度，更多的维度是怎么样去跟进、去保持，以及怎样让这些技术真正的成为应用，成为每一个场景中和每个人日常生活息息相关的东西，“技术的进步如果不能够解决现实问题，它就是炫技的‘屠龙之术’，没有意义”。而对中国而言，更有意义和更有价值的，就是应用落地的优势，以实用为本。

腾讯云副总裁、腾讯混元大模型负责人刘煜宏在接受澎湃新闻等媒体采访时，曾谈及对于大模型“内卷”的看法，称现在的大模型能力还远远达不到高频的用户需求，和场景匹配度较低，导致渗透率还不足。

此外，如何找到适合自己的商业模式，也是大模型厂商要面对的长期问题。

李明顺表示，目前，尤其在C端（客户端），大模型还没有找到最佳的商业模式，通过会员收费（的模式）已经被价格战削弱。但从长远来说，这也许是可行的，因为人工智能可以结合一些应用，比如说C端的社交，还有各种平台的娱乐属性，打造出新型产品。

李明顺进一步指出，目前的价格战，有利于有流量的公司，而一旦有了市场占有率之后，不管是什么样的产品形态，都可以像互联网模式那样进行收费。在B端，也可以抢占更多的产业的场景，把自家的大模型嵌入进去，但大模型企业也正面临和互联网一样的问题，也就是“在产品技术没有绝对领先、产品同质化的情况下，如何获取用户”。

关于大模型企业是否已经突破之前的算力问题，周健向澎湃新闻记者表示：“算力瓶颈实际上是在训练端，不是在推理端，推理端可以通过小型化之类的方法解决。除了算力，大模型企业现在面临的是场景问题，也是产品本身定义的差异化问题。通过降价的方式去收集数据，也是为了确认什么样的场景适合谁，进而做差异化竞争。”