看不见的大模型，看得见的生产力

在大模型领域，智源是全球唯一没有背靠大厂的非企业研究机构，也是国内最早系统布局大模型技术研发、开源生态建设、人才培养和企业培育的新型研究机构。“过去每次科技平权都能催生重大产业机会”，既有企业从业经验又有研究机构背景的新任智源院长王仲远，对科技赋能产业的体会更深。国家对人工智能的定义也更加具体：人工智能是发展新质生产力的重要引擎。

功夫下在风口之前

一次两次，月之暗面CEO杨植麟在2024北京智源大会现场被参会者围了至少三次，一年前OpenAI创始人山姆·奥特曼在智源大会视频发言时，现场的躁动同样明显。

2023—2024年，AI科学家、科技大厂CEO、明星初创企业创始人聚在各种场面为大模型布道，台上的不管是不是技术咖，或多或少都听过智源的名号，不少还直接参与过智源当年的大模型研究项目。百度CTO王海峰曾担任智源理事、智谱AI创始人唐杰曾任智源副院长、杨植麟参与过悟道的研发。

这些AI弄潮儿不是当下才与智源结缘，智源也不是在大模型风起后才投身其中。

2019年，智源开始布局大模型，2020年组建悟道攻关团队、启动大模型研发。2021年3月首发悟道1.0大模型，6月又拿出了悟道2.0，智源用1.75万亿的参数创造了当时“世界最大”大模型纪录，是OpenAI彼时最先进的大模型GPT-3参数量的10倍。

科研讲究体感，要提出问题，作出判断。“人工智能大模型时代即将到来”的判断，给了智源毫无保留的勇气，就连“大模型”这个中文词汇，都是智源最先提出的。

何为大模型？智源研究院理事长黄铁军认为要具备三个条件：规模要大，参数达百亿规模以上；涌现性，能够产生预料之外的新能力；通用性，不限于专门问题或领域，能够处理多种不同的任务。

2023年大模型进入公众视野，悟道系列模型已升级到3.0版本，涵盖语言、视觉、多模态等基础大模型，并全面开源。当时斯坦福大学关于基础模型的讨论中，智源与Google、微软、Facebook（现Meta）等科技巨头并列，成为世界大模型研究的代表性机构。

“历史上多数研究成果的出现是偶然事件，没人能规划出来，所有努力都是为了提升概率——汇聚优秀的研究人员，为他们提供能够碰撞思想、发现问题、寻找协作伙伴的社区环境。”智源研究院创始理事长张宏江给图灵奖获得者Yann LeCun自传写的序言，更像智源后发先至的原因。

要做系统工程

2018年初，北京市出台《北京市支持建设世界一流新型研发机构实施办法》，进行科技体制的飞跃式改革。12月，在科技部和北京市委市政府的指导和支持下，智源正式成立。

此前，科研管理流程复杂，从立项建议到指南发布再到经费申请、评审通过，周期漫长，难以适应强竞争环境下日新月异的科研需求。按照这种体制，研究机构2020年10月提出立项建议，最快2022年才能正式展开大模型研究。智源模式从立项到推出大模型，只用了不到5个月。

这是一种介于大学和企业的新型研发机构。新在不以论文为最终评价指标，不以产品为评价指标，而是要做创新性系统；新在把清华、北大、Facebook人工智能实验室、百度等不同机构以及企业的学者聚在一起办大事；新在瞄向大问题，保持对重大科学问题的敏锐眼光，进行前瞻布局。

“高校模式已经运行了几十年，较难有组织、有规模、跨团队地做系统性研发。企业也会投入做研发，但更倾向于研发与业务强相关的。智源会做3—5年甚至更长时间才能看到成果的研究项目。”王仲远在接受北京商报记者专访时表示。

当下，智源的信心还在于国家对人工智能的笃定。2024年3月，中共中央政治局常委、国务院总理李强在北京调研时明确：人工智能是发展新质生产力的重要引擎。

新质生产力是创新起主导作用，摆脱传统经济增长方式、生产力发展路径，具有高科技、高效能、高质量特征，符合新发展理念的先进生产力质态。它由技术革命性突破、生产要素创新性配置、产业深度转型升级而催生。“过去每次科技平权都能够催生重大产业机会，大模型可以带来新的科技平权。”王仲远坚信。

打个比方，大模型是“智力”的载体，以AI为中心的浪潮是智力运营，最底层是技术软硬件系统，最上层是AI应用，大模型处于两者中间，扮演“树干”的角色。大模型的意义是将“智力”变成像水、电、网一样的公共服务，通过云计算向大量企业或个人提供AI服务。

这是一个系统工程，“需要集中投入资源、集中人力，不能很多人在做但各做一摊，而是要形成一个技术体系”。黄铁军举例。“发展人工智能就如同炼钢和发电，需要一整套技术体系来保证生产出高质量的钢、以比较低的成本稳定地发电等。”黄铁军说。

要比产业走得更超前

智源搭建的技术体系包括：大模型全家桶、大模型操作系统、数据集、训练框架、算子库等。这些成绩和智源的愿景目标等一起挂在智源大厦一楼的墙上。

愿景目标分成机制体制、产业发展等五大板块，总结起来就是创新。“智源要做最前沿的人工智能技术的研发，去引领和预判人工智能的发展，要比产业走得更超前。”王仲远详细解释，“智源会做高校做不了、企业不愿做的研发，做3—5年甚至更长时间才能看到成果的研究项目。”在他看来，当大模型技术能力达到一定程度后，会分出两大方向，“一个方向去跟产品结合，推动应用，发挥商业化价值。另一方面，有少量的几家机构持续做最顶尖的大模型的迭代和优化。不管企业还是研究机构，应该继续去攻坚技术”。

比如多模态，国内绝大部分的企业都选择DiT架构进行研发。“这是因为DiT是已经被验证的路线，智源希望把不同模态的信息，比如文字、图像、视频、语音，从一开始就放在一个模型里训练。”王仲远用人脑比喻，“这种多模态大模型能够看到世界、理解和推理。未来，大模型跟硬件结合，也就是具身智能,能够进入物理世界服务人类。”

企业贴近市场，向上找场景，研发机构聚焦核心技术突破，向下做加持，智源属于第二种，和应用与场景离得较远，却用开源的方式做产业界的后盾。

“人工智能不等同于大模型，它只是人工智能的一个流派。”王仲远向北京商报记者解释。当下的智源也对类脑研究、数字心脏等其他人工智能技术全力以赴，这意味着人工智能在其他产业的想象空间没有上限。