钛媒体App 11月19日消息,据中科创星等消息,北京行云集成电路有限公司(简称“行云集成电路”)近期连续完成总额数亿元的天使轮及天使+轮融资,投资方包括多家头部战略方及知名财务机构。
据天眼查等信息显示,参与行云集成电路项目的投资方包括智谱AI、仁爱集团、中科创星、奇绩创坛、水木清华校友基金、嘉御资本、春华资本、同创伟业、峰瑞资本等机构。
11月19日,行云集成电路创始人、CEO季宇对钛媒体App透露,公司计划于2026年实现 AI 组装机产品的量产。
据报道,行云集成电路团队表示,新一轮融资完成后,将持续完善消费级和超算级产品线的两代产品,尽早向市场推出能够使用高质量大模型的超低成本单卡以及高性能超算级云端产品。
今年31岁的季宇,是清华大学物理本科、计算机体系结构方向博士,也是“华为天才少年”之一,主攻体系结构、AI芯片方向。而在华为期间,季宇曾是海思昇腾芯片编译器专家,负责多个昇腾编译器项目,同时作为研究科学家,展开AI编译器领和处理器微架构域诸多挑战性问题攻关;计算机体系结构《自然》论文共同一作,计算机学会CCF优博奖获得者。
行云集成电路联合创始人、CTO余洪敏,是华中科技大学本科、中科院半导体所博士,百度昆仑芯、海思车载昇腾芯片等多款芯片总负责人,地平线芯片研发总监,长期领导和管理100+人团队,熟悉芯片研发设计全流程,具有10+款芯片成功流片与量产经验,主导多款先进工艺数据中心芯片的架构、设计实现和量产部署。
季宇表示,今天的大模型基础设施很像上世纪80年代的大型机,但之后的PC产业和互联网产业都是建立在白盒组装机体系之上的。而行云集成电路也希望为大模型时代的“PC产业”和“互联网产业”构建类似的底座。目标是通过异构计算和白盒硬件形态革命性地重塑大模型计算系统,推动大模型走向更高质量和更低成本,从而解决大模型产业中面临的算力成本和供应问题,推动产业链价值重塑,为ai应用时代提供底层支持。
在季宇看来,行云集成电路想给 AI 做x86(架构),但重点可能不是架构或指令集,实际上是希望支撑 AI 的PC和互联网底座重新变成组装机(组装PC以及组装服务器),做法是引入一到两款特定规格的GPU作为组装机的新组件,使得最高端的大模型也可以在组装机上低成本搭建起来。
具体来说,“异构+白盒”是“行云”对计算模式进行革新。即在一般的x86服务器上以PCIe拓展形式部署,形成显存密集型产品。这种产品可以与英伟达等公司的算力密集型产品,配合使用或独立使用于对显存需求更高的场景。
季宇在此前一次演讲中提到,大模型时代新兴竞争维度是“显存(内存)容量”和“带宽”。其中,内存容量决定大模型业务质量,而内存带宽成本决定大模型业务性价比。
“推动组装机体系成为基座,促进AI时代的PC和互联网落地,组装机也把PC和服务器的定义权还给客户。”季宇表示,通过增加组件重新激活 AI 服务器组装机体系,使得大家可以组出支撑高端 AI 应用的组装机,从而拉动更多人一起在这一体系的飞轮上转起来。
简单来说,行云集成电路是通过定制化GPU,重点加强互连和显存做 AI 组装机,利用CPU+GPU的形式交付,使得AI大模型的推理效率更高、成本更低。多位半导体行业人士向钛媒体App补充称,这种形式最大难点在于客户的要求较高。
季宇表示,他对Scaling Law(尺度定律)的未来发展还是比较看好的。OpenAI o1的推出带来了一波新的算法热潮,但真正支撑Scaling还是需要深入思考里面的很多基本假设,包括强化学习、奖励机制(Reward)和其可扩展性等。今天AI泡沫的争论,本质上是类似于探讨怎样用IBM大型机和工作站创造一个繁荣的PC产业和互联网产业。
“今天所有AI商业化探索过程中遇到的困境,都可以在‘大型机作为PC产业和互联网产业的载体’这一假设下找到参考。”季宇认为,当机器的门槛低到消费级可以接受的成本,边际成本承担的商业模型也会发生变化,带来进一步的产业繁荣。如果计算机体系能支撑消费级可以接受的价格享受极致的AI体验,大模型产业会进一步进入一个类似软件行业零边际成本的超高速爆发期。
值得一提的是,随着大模型算力需求增长,当前国内GPU芯片领域正迎来新的资本发展机遇,壁仞科技、燧原科技、摩尔线程等多家公司启动IPO上市辅导,开始冲刺上市,而市场也极为看好AI芯片未来市场空间。
11月18日举行的第二十一届中国国际半导体博览会(IC China 2024)上,SEMI(国际半导体产业协会)全球副总裁、中国区总裁居龙表示,AI 将推动芯片产业规模持续增长,成为全球经济增长的核心之一。预计到2030年,全球半导体市场规模有望增长到1万亿美元,年均复合增长率达8%。