你知道制作这个视频背后技术吗?
大谷表示,「使用了开源AI绘画项目Disco Diffusion」。
据大谷介绍,这个视频自己耗时10天才完工。
这期间,大谷全程负责「监工」,盯着AI干活,并提供给AI需要的摄像机镜头位移坐标,补充一点场景文字信息。
到后期再填上字幕和微调剪辑,就完成了这个作品。
而他做这个视频的动机很简单,
想要研究一下AI的绘画潜力怎么样。
那么这个AI作画的能力究竟如何?我们来个「慢镜头」欣赏一下…
「转身那一刻,世界崩落」这句歌词一出,
开场画面中,粉色的童话世界瞬间变成了万丈深渊的魔域世界,让人有一种很大的视觉反差。
再来看,AI根据歌词「天空如同被雷鸣闪电划破、玫瑰盛开」填画的表现力也很不错。
其中像「闪电」和「玫瑰」这样的关键信息都在画面中生成了。
但是,当你仔细盯着这个动画不要眨眼睛时,是不是真有种自己吃了云南毒蘑菇的感觉。
天旋地转,简直太魔幻了…
Boom,Boom,Boom,Boom歌词一出,AI作画的风格就很诡异了…
很明显歌词中都在说的是,心跳Boom。
而AI却把炸弹、烟花、气球,白色框框杂糅到一个画面中。
这画风,这调调和整首歌的意境不太相融了。
可以说,AI的智商在理解句子上没问题,而理解整首歌词内涵还是不太够(doge)。
到了最后收尾,AI从前面很有意境的风格转化成了赛博朋克风。
星际飞船、行星、宇宙…
就比如下面这个场景很类似「黑客帝国」中尼奥从母体诞生周围环境的一幕。
可以看到,AI根据输入的文字歌词和场景描述生成了每一帧画面中的世界。
每一幅画面亦真亦幻,似梦非梦。
技术介绍:AI作画「卷」出新高度
在介绍这个工具之前,先来看两张图片。
看完这两张图片,你可能会觉得,这是哪个大牛插画师的作品。估摸着,这么精良的作品,放到市场上卖个几千不是啥大问题。
如果真是大牛画的,那还真没什么亮点了。虽然很好看,但也不是不能完成的。
可如果,这两幅画,还有一大堆别的一样好看的画,都出自AI之手呢?
你会不会觉得不可思议?
真相是:这两幅画的作者都是Liliia Sitailo。准确来讲,Sitailo只负责输入指令,作画部分完全交由AI完成。
如果你让我说,这么完美的构图、清晰的思路,还有身临其境的氛围、抓人眼球的色彩,都是AI完成的,我还真不一定信。
事实证明,这款谷歌开发的名为Disco Diffusion的AI作画工具非常之成功。目前,这个工具已经更新到了第五代,V5版本。
这是一款由谷歌Colab平台开发的,利用人工智能深度学习进行数字艺术创作的工具,基于MIT许可协议,目前已开源。
用户可以在谷歌Drive直接运行。
有了这个工具,不需要用户懂什么构图知识,也不需要有任何艺术细胞,只要想点子就可以了。
另外,大家熟知的DALL-E也同样在4月迎来了更新。
Open AI对画图界的扛把子DALL-E进行了2.0版的全面升级。让自然语言生成图像达到了全新的高度。
比如下面这幅很有穿越感的画。
还有之前占据AI画画老大哥地位的Imagen,做了一副「有点怪,我再看看」的画。
谷歌除了上面提到的Disco Diffusion,最近也有一款名叫Parti的画画AI问世了。
Parti,全名叫「Pathways Autoregressive Text-to-Image」,是谷歌大脑老大Jeff Dean提出的多任务AI大模型蓝图Pathway的一部分。
我们来看看Parti的作品:
看完后,是不是顿时感觉,会画画的AI都这么卷了…
大谷是谁?
提到大谷,你一定会立马想到「AI复活」系的专业户。
大谷1991年生于北京,获得了纽约视觉艺术学院电脑艺术硕士学位。
作为一个艺术家,音乐家,程序员和独立的游戏设计师,生产力真是爆炸。
此前,我们已经看到过很多由他创作的一些作品。
最出名的就是用AI修复100年前老北京影像。发布后,这段修复Vlog爆火,引来许多网友的关注。
另外,像他用AI修复让李大钊、陈延年等老先辈们露出笑容也得到网友一致好评。
还有AI还原宋明清三朝皇帝、泰戈尔、梅兰芳,百年前上海时装秀….
所以说称其为「AI复活专业户」也不为过。
不过,这次大谷却为我们带来了不一样的创作。