百度飞桨Paddle Lite与海云捷迅基于Intel FPGA的自研开发套件完成适配

AI应用信息10个月前发布 XIAOT
68 0

在技术革新的浪潮下,人工智能在产业升级、改善人类生活等方面发挥着越来越重要的作用。从科研、金融、零售到工业、农业等越来越多的行业与业务场景,无不渗透了人工智能的威力。此外,为人工智能深度学习定制的硬件近年来也有井喷之势。

AI人工智能产业又一重磅合作,百度飞桨(PaddlePaddle)深度学习平台的高性能轻量化推理引擎Paddle Lite与海云捷迅自研的基于英特尔® FPGA开发套件正式完成兼容性适配。实现人工智能算法的快速部署,加速AI科技的普及与进步,使AI行业赋能更多应用场景。

FPGA具有灵活高效、可重复编程特性,可实现定制性能、定制功耗、高吞吐量和低延迟的特性,因此在人工智能领域的应用越来越广泛。随着数据洪流时代的到来,算法不断演进和迭代,软硬件的结合可以更好的充分释放数据的巨大潜能。

重庆海云捷迅科技有限公司基于英特尔® FPGA,包含英特尔® Stratix®系列、英特尔®Arria®系列、英特尔®Cyclone®系列的开发套件,在百度飞桨的轻量化推理引擎Paddle Lite上充分兼容,高效稳定运行。此次海云捷迅与百度的合作,旨在助推FPGA应用生态,让AI赋能更多应用场景,加速AI应用落地。

百度飞桨Paddle Lite与海云捷迅基于Intel FPGA的自研开发套件完成适配

百度飞桨与海云捷迅兼容性认证书

关于飞桨

飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,是中国首个自主研发、功能完备、 开源开放的产业级深度学习平台,集深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件于一体,包含完整的开发、训练、推理的端到端深度学习AI模型开发工具链。其中,Paddle Lite是一个可以在边缘端、移动端等场景下用于AI模型部署的高性能轻量化推理引擎。典型应用场景包括:智能闸机、智能家居、自动驾驶、机器人、智能抠图、AR/VR手机应用等。与重庆海云捷迅探索的边缘应用的方向不谋而合。

百度飞桨Paddle Lite与海云捷迅基于Intel FPGA的自研开发套件完成适配
关于海云捷迅

重庆海云捷迅科技有限公司(简称:AWCloud海云捷迅)以FPGA与人工智能技术为核心,致力于研究智能硬件高效使用,提供多种智慧场景解决方案,助力智慧城市及相关智能行业升级改造,推动中国FPGA及人工智能生态建设发展。AWCloud海云捷迅目前已取得数十项软件著作权,并已申请实用新型专利和发明专利。重庆海云捷迅不仅自主研发了FPGA开发板、人工智能边缘实验平台、育智芯|英特尔人工智能实验室解决方案,及农业智联网实训场景等产品,还以技术革新为发展基石,不断提高自身综合实力。重庆海云捷迅不但具备FPGA项目开发能力、FPGA+AI实验室相关软硬件产品研发和交付能力,还能够提供FPGA工程师培训和FPGA云平台建设和运营等服务。

海云捷迅致力于推动中国FPGA及人工智能生态建设发展,已与上百所国内顶尖高校开展高层面、多维度的合作。通过与众高校开展各类合作,不断助力高校FPGA和人工智能相关专业的课程体系及人才培养支撑平台建设,加速技术应用落地及FPGA产业发展。

百度飞桨Paddle Lite与海云捷迅基于Intel FPGA的自研开发套件完成适配
Intel FPGA SoC芯片简介

  • Intel Cyclone V SoC芯片含有丰富DSP硬核资源
  • ALM:Adaptive Logic Modules 自适应逻辑块,可以自动综合为DSP软核资源
  • ARM CortexTM-A9
  • 丰富的片上存储
百度飞桨Paddle Lite与海云捷迅基于Intel FPGA的自研开发套件完成适配百度飞桨Paddle Lite与海云捷迅基于Intel FPGA的自研开发套件完成适配

软件架构

PaddleLite支持ARM和FPGA的混合调度,ARM通过FPGA驱动实现和FPGA的通信和数据同步。
百度飞桨Paddle Lite与海云捷迅基于Intel FPGA的自研开发套件完成适配

FPGA逻辑架构

  • 控制状态机:实现FPGA逻辑侧与ARM侧通信
  • 可扩展卷积核:实现卷积与DW卷积操作
  • 片上存储:通过策略设计,实现数据与权重重用。
百度飞桨Paddle Lite与海云捷迅基于Intel FPGA的自研开发套件完成适配

海云捷迅与百度飞桨的合作成果

  • Intel FPGA的ARM侧部署Paddle Lite框架,结合海云自研的ARM侧的用户程序与驱动、FPGA 逻辑侧的算子,用户基于FPGA可以使用Paddle Lite框架对人工智能算法实现快速部署。
  • 相对于传统在FPGA上的部署人工智能算法,基于结合Paddle-Lite的Intel FPGA具有部署快,用户可以不关注底层硬件的特点。
  • 相对于在GPUCPU上部署人工智能算法,基于结合Paddle-Lite的Intel FPGA具有低功耗、低延迟的特点,第一代发布版本的性能是FPGA内嵌硬核ARM的两倍。
百度飞桨Paddle Lite与海云捷迅基于Intel FPGA的自研开发套件完成适配

这只是海云捷迅与百度飞桨合作的第一步,接下来,海云捷迅与Paddle Lite将持续更新后续优化版本,持续性能优化,持续兼容其他最新Intel芯片,Agilex系列。在未来,双方还将在RISC-V兼容Paddle框架上展开合作。随着双方生态的逐渐扩大,软硬件充分结合的生态势必将发挥更大的效能,助力人工智能行业多场景落地。

    © 版权声明

    相关文章