最近,一个名为DragGAN的AI 图片编辑工具爆火,它实现了点击鼠标、拖动关键点就能达到Photoshop的效果。对比之下,使用Photoshop等工具时候,需要具备相对专业的技能才能灵活,精确地控制单个对象的位置,形状,表达或排列。
简单的说,DragGAN使用户能够在图像上确定一个点,就能改变图片结构和整个像素。它与其他流行的生成AI图像工具(如Dall-E和Midjourney)有很大的区别,后者虽然能够通过文本提示生成特定的图片,但无法精确输出所需的姿势或布局。
据了解,DragGAN新模型由MIT、谷歌、马普所等机构联手打造,该项目相关论文已入选SIGGRAPH2023,研究人员展示了一种控制GAN进行图像处理的新方法。
简单拖拽就能实现图片编辑
只要处理的图片与GAN训练数据集的类别匹配,DragGAN就可以处理逼真的图像。这些类别包括动物、汽车、人、细胞和景观。
论文示例展示了在一个简单的界面中,用户可以将他们在图像中定义的点拖动到所需的位置,就是实现图片编辑。例如,让猫咪闭上眼睛,让狮子转头并张开它的嘴,或将汽车转换为另一种模型。
DragGAN 还提供了遮罩功能,允许用户突出显示他们希望更改的图像的特定部分,而其余部分保持不变。
该团队表示:”通过DragGAN,任何人都可以通过精确控制像素的位置来变形图像,从而操纵不同类别的姿势、形状、表情和布局。”
DragGAN 研究论文还强调了该工具的最大优势,界面的简单性和直观性。在几秒钟内,用户可以掌握功能,而无需弄清楚底层技术。
未来,如果将DragGAN 与AI图像生成工具搭配使用,用户将能够实现更接近他们心目中的图像的输出。