火山方舟加速大模型和大算力应用落地

AI应用信息11个月前发布 XIAOT
123 0

6月28日,2023火山引擎V-Tech体验创新科技峰会上,火山引擎正式发布“火山方舟大模型服务平台。

火山引擎智能算法负责人、火山方舟负责人吴迪以《绽放·共赢,“火山方舟”大模型平台启航》为主题进行演讲,深度阐释了火山引擎大模型理念,解读“火山方舟”的功能特点,为模型提供方以及模型使用方带来全新价值。

01

大模型百花齐放,“火山方舟”启航

这一轮由大模型、大算力带来的技术变革,让更多人看到了无限可能。这种变革的影响是巨大的,大模型将渗透到千行百业,变革人机交互界面,影响人们获取和处理信息、学习和掌握知识的习惯,最终深刻影响行业格局。同时,B端大模型供给将长期呈现百花齐放的面貌,创造大量的商业价值。
火山方舟加速大模型和大算力应用落地
大模型的算力消耗由三个部分组成:
第一部分是大模型的提供商和研究机构,将为各行业提供极具竞争力的通用基座模型或垂直模型;
第二部分是大量颇具技术能力的公司,一方面会保持自研自用的模型训练投入,另一方面也会调用若干商用模型,落地到业务的不同场景;
第三部分是以大模型应用为主的各行各业,他们会把大模型能力深入到诸多细分场景,在提升自身经营效率的同时,把大模型的能力渗透到我们生活的方方面面。
火山方舟加速大模型和大算力应用落地

大模型即将出现第二条增长曲线(勘误:模型训练为紫色,模型应用为蓝色)

上面的曲线图体现了对未来趋势的判断,横坐标是时间,从今天开始向后展望2-3年,纵坐标是国内的机器学习算力消耗。
今天,以预训练为代表的第一条增长曲线快速攀升,代表了大模型创业者勇攀高峰的决心和对前景的期待,这条曲线需要通过第二条曲线的持续攀升来转化现实。
我们畅想一下,也许到了2024年的秋天之后,以推理为主的大模型应用消耗将超过届时预训练消耗60%,并且在2025年某个时刻超过预训练的整体算力消耗。
火山方舟加速大模型和大算力应用落地

“火山方舟”加速大模型市场正向循环

大模型市场生机勃勃,火山引擎希望能够加速这个进程,推动大模型在千行百业更快形成生产力。火山引擎推出大模型服务平台“火山方舟”,致力于帮助千行百业更容易地获取模型,更放心地使用模型,更高效地打造应用,在模型提供方和模型使用方之间促进研究、训练、应用、变现、反哺研究地正向循环。
模型提供方可以通过平台以更低的成本触达海量客户,用更小的代价在ToB市场规模化。基于严谨的安全互信机制,兼顾灵活性和安全性。同时,火山引擎技术团队将持续提供性能优化的方案,带来最具竞争力的性价比。
模型使用方可以通过统一的工作流对接多家模型提供方,为不同业务场景选择最合适的模型。此外,“火山方舟”和火山引擎机器学习平台是一个有机的整体,数据集管理、模型训练、模型迭代与大基座模型的应用被紧密融合和衔接在一起。火山引擎的算法、解决方案和交付团队也将持续协助客户,把平台用好,做好大模型落地。
“火山方舟”由多个核心部分构成,平台的行动路线设计符合大模型应用的工作习惯,并融入了火山引擎对用好大模型的理解。
模型广场,模型提供方提供了不同版本、不同尺寸的模型,客户可以直接与其交互,获得直观体验。也可直接调用推理API,接入生产环境。这是一条敏捷的短链路,适合进行快速分析和业务A/B实验,让算法工程师和业务团队不断缩短从新想法到试一试的距离。
模型评估,用好大模型首先要确定业务需求,并为之设计一套可量化的评估指标。在不断对比、评估、试验的过程中,积累评估数据。快速迭代,为多样化的业务场景挑选不同的、最合适的模型。
模型精调,对于一些要求较高的垂直场景,客户可能需要利用自有数据或领域的非公开数据进行持续训练,并且建设和积累自己的精调数据集,同一条精调数据集对多个基座模型同时发起精调任务,同时进行自动化评估,精调的效果和运行指标均能在平台实时跟踪。对于精调良好的运用,小模型在特定工作上的表现可能接近通用大模型的水平,由此也可以进一步降低推理成本。

02

三类互信技术,促进互信共赢

大模型实践的模型提供方和使用方有可能是分离的,之前的CV/NLP模型以企业自产自销为主,但大的基座模型,包括语言、视频音频模型等,并非每一个客户都能凭借自身力量做到最好,且由于大模型的训练成本高昂,对模型资产的保护变得迫切和重要。此外,模型客户与大模型的一切交互都需要进行严格保护。
火山引擎对数据资产的处理原则,是在双方数据资产汇聚的地方满足严格的可用、不可见要求,包括模型的查询服务和利用客户数据精调后的模型,当双方合作关系告一段落之后,这些将被就地销毁。火山引擎在促进双方互信共赢过程中发挥重要作用,并通过三类互信技术推动大模型进一步发展。
火山方舟加速大模型和大算力应用落地
“火山方舟”三类互信技术推动大模型落地
安全沙箱,通过计算隔离、存储隔离、加密、私有的逻辑通信链路以及共同的流量审计,确保安全沙箱只能向模型使用方传递response,杜绝任何人进入沙箱或从沙箱中向外泄露数据的可能性。
硬件支持,未来将基于硬件的可信计算环境进行方案加固,其中既有结合CPU的TEE技术,也有基于英伟达H800、H100的可信计算技术。
联邦学习,经过多年发展的联邦学习技术将在大模型领域发挥重要价值,其主要通过对数据资产的拆分来获取大模型提供方和使用方的信任。模型使用方和提供方之间,传递的是机器学习的中间结果。这一技术火山引擎还在与合作伙伴进行进一步的研究。
    © 版权声明

    相关文章