AIGC开发平台AI开发框架

LivePortrait

一个创新且高效的肖像动画生成框架,通过基于隐式关键点的框架和丰富的控制模块,实现了从单张静态图像生成逼真、可控的肖像视频

标签:
chatglm
LivePortrait

LivePortrait是什么:

LivePortrait是一个高效的肖像动画生成框架,旨在从单张源图像合成逼真的视频。该框架使用源图像作为外观参考,从驱动视频、音频、文本或生成中获取运动(如面部表情和头部姿势)。它通过探索和扩展基于隐式关键点的框架的潜力,有效地平衡了计算效率和可控性.

主要特点:

  • 高效的生成速度:在RTX 4090 GPU上,生成速度达到了12.8毫秒,显著提高了肖像动画的生成效率.
  • 基于隐式关键点的框架:采用隐式关键点来表示混合形状,通过小的MLP(多层感知机)模块实现,计算开销可以忽略不计.
  • 多风格和多尺寸适应性:能够处理各种风格(如现实主义、油画、雕塑、3D渲染)和不同尺寸的图像,具有良好的泛化能力.
  • 丰富的控制模块:包括缝合模块和重定向模块,增强了对生成动画的可控性,如控制眼睛和嘴唇的开合程度等.
  • 大规模高质量数据训练:使用约6900万高质量帧进行训练,采用混合图像-视频训练策略,提升了生成质量和泛化能力.

主要功能:

  • 肖像动画生成:从单张静态图像生成逼真的肖像视频,能够模拟面部表情和头部姿势的变化.
  • 视频驱动的肖像动画:使用驱动视频来控制生成视频的运动,使动画更加自然和生动.
  • 眼睛和嘴唇重定向:可以根据给定的标量控制眼睛和嘴唇的开合程度,实现更精细的表情控制.
  • 动物肖像动画:通过在动物数据上微调,能够精确地驱动人类表情到动物身上,生成可爱的动物肖像动画.
  • 肖像视频编辑:对生成的肖像视频进行编辑和调整,以满足不同的创作需求.

使用示例:

  • 肖像动画生成:从一张静态的人像照片生成一段视频,模拟出人物的微笑、眨眼等面部表情.
  • 眼睛和嘴唇控制:在生成的肖像动画中,控制人物的眼睛开合程度,使其呈现出不同的表情状态,如睁大眼睛或闭眼微笑;同时也可以控制嘴唇的开合,模拟说话或唱歌的动作.
  • 动物肖像动画:将人类的表情驱动到动物身上,生成一段可爱的动物唱歌或跳舞的视频,如让一只猫模仿人类的表情唱歌,或者让一只狗模仿人类的表情跳舞.

总结:

LivePortrait是一个创新且高效的肖像动画生成框架,通过基于隐式关键点的框架和丰富的控制模块,实现了从单张静态图像生成逼真、可控的肖像视频。它在生成速度、泛化能力和可控性方面均表现出色,能够适应多种风格和尺寸的图像,并支持对眼睛、嘴唇等细节的精细控制。此外,LivePortrait还能够将人类表情驱动到动物身上,生成有趣的动物肖像动画,具有广泛的应用前景和实用价值.

    相关导航