近十年间,开源对 AI 的发展起到极大推动作用,然而 AI 应用始终是全行业的“阿喀琉斯之踵”。对于大多数工程师而言,AI 模型存在高使用门槛、部署难度大等难题,无法释放 AI 应用更多潜能。在不断探索中,一种服务 AI 开发者的新模式逐渐显露,模型即服务(Model as a Service)因大幅简化模型应用门槛备受欢迎。这次,中国的AI 模型社区终于来了。11 月 3 日,2022 云栖大会杭州现场,阿里达摩院联手CCF开源发展委员会共同推出AI模型社区“魔搭”ModelScope,旨在打造下一代开源的模型即服务共享平台,致力降低 AI 应用门槛。首批合作机构还包括澜舟科技、智谱AI、深势科技、哈工大讯飞联合实验室、中国科学技术大学等。阿里巴巴集团资深副总裁、达摩院副院长周靖人表示,AI 模型较为复杂,尤其是要应用于行业场景,往往需要重新训练,这使得 AI 只掌握在少数算法人员手中,难以走向大众化。而新推出的 ModelScope 魔搭社区提供众多预训练基础模型,只需针对具体场景再稍作调优,就能快速投入使用。据介绍,社区首批上架超 300 个模型,其中中文模型超过 100 个,覆盖了视觉、语音、自然语言处理、多模态等 AI 主要领域,覆盖主流任务超过 60 个。上架模型均经过专家筛选和效果验证,包括150 多个 SOTA 模型和十多个大模型,已开全面开源并开放使用,开发者可在平台上免费体验与下载使用。AI 之前的使用大多以付费 API 提供,魔搭社区不仅提供了免费的 API,而且提供的是可编程的 API 接口,输出的不再是固定结果,而是结构化的数据,以便开发者能二次开发。同时,社区提供的模型结合领域数据集,提供了二次开发的定制化能力,为模型在不同具体使用场景上使用提供了可能。由于魔搭社区不仅提供开源模型,更提供开源之后的模型使用服务。从这个意义上说,魔搭社区探索的是 AI 开源 2.0 新范式,在这种服务新范式下,为开发者使用 AI 模型带来更多惊喜和便利。打破 AI 应用瓶颈,模型社区势在必行AI 产业化应用面临的瓶颈主要体现在以下两点:一方面是现有 AI 技术的局限性,单一 AI 模型只能针对单一的任务场景,泛化性能较为有限,面临新场景时需要重新训练,二次开发难度较高;另一方面是因为模型训练、推理、安装部署等配置复杂,使用门槛高。这使得 AI 只掌握在少数算法人员手中,难以走向大众化。作为业内顶尖研究机构,达摩院对此有切身体会。自 2017 年成立以来,达摩院在 AI 领域进行大量研究和探索,产出了一批重要的 AI 模型,已经用于城市大脑、工业视觉、电商翻译、医疗AI、智能客服等诸多场景。预训练模型的兴起让 AI 有了从手工作坊走向工业化大生产的机会。AI 模型通过上游统一的预训练后,面对下游各种任务场景后,只需要一些调优(finetune)就能有较好效果,研究者不再需要反复造轮子。不过,预训练模型尤其是大模型的研发门槛高,算力资源消耗大,它成为了少数机构的竞赛。站在行业发展的角度看,这些模型的潜力仍然未得到充分发挥,AI 产业化的道路还充满挑战。达摩院意识到,只有进一步推动 AI 开放,才能实现 AI 普惠。达摩院不仅决定集中开源开放这五年来的重要 AI 成果,更不留余力打造 AI 模型社区。构建开放社区绝非易事。在技术层面,需要持续不断地优质的模型供给,包括研发投入高的大模型;同时还提供易用的平台用户体验才能得到开发者的认可。在社区共建上,还要打消高校、科研机构、企业、个人等方面的疑虑,才能共同建设中文AI模型社区的新生态。魔搭社区三大特色服务,普惠 AI 开发者社区主要有三大优势:1、提供丰富的中文模型,充分满足本土化需求语言是从感知智能迈向认知智能的关键,理解中文,才能在中文世界的任务场景中取得更佳效果。现实情况却是,中文为母语的 AI 开发者人数众多,但世界上的中文 AI 模型数量稀少。魔搭社区关注本土需求,第一批提供的中文 AI模型已超过 100 个,占比超过三分之一,覆盖了自然语言处理、语音等常用的任务,实用性较高。同时,社区还涌现了一批探索人工智能前沿的中文大模型,如阿里通义大模型系列、澜舟科技的孟子系列模型、智谱 AI 的中英双语千亿大模型、中文版 GPT-3、中文版 CLIP 等。社区鼓励中文 AI 模型的开发和使用,希望实现中文 AI 模型的丰富供给。2、零代码上手+强算力加持,带来绝佳用户体验对于模型使用者,从代码下载到安装部署再到效果验证,以前往往需要数天,现在只要几个小时甚至几分钟。通过全新开发的调用接口和统一的配置文件,平台提供模型探索、环境安装、推理验证、训练调优等一站式服务,0 代码在线体验模型效果,1 行代码实现模型推理,10行代码实现模型定制;在线开发,开箱即用,无需任何安装部署。对于模型开发者,平台提供模型管理、数据集管理、多人协同、创意工坊、社区互动等功能,让开发者可以轻松实现创新想法,并获得用户反馈,持续改进模型,最终收获影响力。此外,魔搭社区基于云的算力支撑和技术支撑,提供了更佳的用户体验,让上层的 AI 模型开发和使用更简单。3、开放兼容,普及 AI 模型应用不同于一般企业举办的社区,魔搭社区更强调其中立性,更开放,模型更丰富,兼容 TensorFlow、PyTorch、Caffe 等多种主流深度学习框架,模型迁移便捷简单,用户可自主选择训练和部署方式,提供更多自主可控的选择。社区旨在推动 AI 的大规模使用,不以盈利为目标,惠及所有开发者,参与者不限机构、不限类型。据介绍,已有数千名开发者参与魔搭的前期测试,他们利用社区的 AI 能力搭建了射击游戏神枪手、简历分析、一键动画片制作等小应用。有参与测试的在校学生表示,魔搭最好的一点是这里只需一行代码即可调用,且调用过程十分简单快捷,即使是对于模型了解较少的开发人员也能快速上手。也有动画建模师称,魔搭中的 2D 关键点模型,很好地适配动捕的工作,卡通化模型可以轻松构建卡通形象,减少了工作量。开发者体验社区的模型,能获得免费的 CPU算力和 GPU 算力的福利。其中CPU算力(8核32G)不限额度,GPU算力(Nvidia-V100-16G32G)限额16个小时。开发者可以参与社区贡献,获得更多免费算力额度。AI开源的未来中国科学院院士、中国计算机学会(CCF)开源发展委员会主任王怀民期待,开源是AI发展的重要驱动力,魔搭社区作为新型的 AI 开源社区,不仅将有力推动AI迈向广泛的落地应用,还将助力中国从开源世界的参与者逐步成长为引领者。中国计算机学会副理事长、澜舟科技创始人兼 CEO 周明博士认为,从依赖算法专家手工调参的手工作坊时代,走向大规模、可复制的大工业时代,AI 模型社区是其中的关键一环,堪称 AI 时代的基础设施,能将预训练模型以较低门槛提供给广大开发者,让 AI 惠及全社会。而达摩院希望,魔搭社区 ModelScope 能成为中国 AI 开发者和使用者的公共平台,甚至全世界的一个 AI 开放平台,能够满足 AI 开发者和应用者的多层次、多样化的需求,促进AI产业的共同繁荣。