人工智能无疑已经成为当前最为热点的技术之一,近些年来它已经对人类社会的很多方面都产生了巨大的影响,这既带来了许多惊喜,也诱发了诸多的疑虑乃至恐惧——它将如何继续发展,并将如何改变甚至颠覆人类社会。
在影视行业,作为人工智能发展的重要分支——AIGC,人工智能生成内容,是近两年来最为热门的话题,无疑也成为影视制作领域的焦点,并成为引发了本文开头提到的好莱坞罢工的导火索之一。
第一次浪潮始于50年代中期著名的达特茅斯学院会议,但其研究成果离民众、政府和投资机构的期望相去甚远——这很大程度上与“智能”一词有关,这是在科学领域,甚至在哲学领域都没有界定清晰的范畴,加以各类科幻作品的引导,很难不让人产生遐想和过高的期望。
第一次浪潮的褪去在很大程度上受限于计算机的运算能力,随着计算机技术黄金时代的到来,在沉寂了不到十年之后,人工智能领域的第二次热潮于80年代初开始了,这次的主角是第二大流派符号主义。
这次比第一次浪潮有了一个很大进步,各类“专家系统”在许多垂直专业领域取得了非常大的商业上的成功,不过对于普通消费者并没有太大影响,伴随着互联网时代扑面而来,这次浪潮也在本世纪初淡出了人们的视线。
在人工智能50岁这一年——2006年,杰弗里·辛顿以及他的学生鲁斯兰·萨拉赫丁诺夫正式提出了深度学习的概念,第三次浪潮的春风刮起来了。虽然深度学习已然成为人工智能的主角,但是符号主义的逻辑推理机制还起着非常重要的作用,就类似人类的感性思维和理性思维是无法分割的一样,在深度学习中也还是要用到大量的逻辑推理。
文本生成领域最著名的就是Chat GPT了,它的名字虽然叫Chat——聊天,但是通过对话的方式,用户可以通过提字数要求的方式使用它生成比较长的文章。影视领域的人自然想到了尝试用它写作剧本,虽然直接生成的剧本还无法达到专业剧本要求,但是使用其生成一些片段性的内容是完全能满足大部分需求的,这也成为导致本文开头所提到的好莱坞编剧工会罢工活动的主要原因之一。
Chat GPT发布以后,各大公司和研究机构纷纷推出各自版本的大语言模型平台,并针对细分领域开始了激烈的竞争,可以预见的是,在剧作、策划案等领域一定是一个各大平台争相竞争的领域,也会成为发展最快的领域之一。
随着Chat GPT成为全世界的焦点,AIGC和相关联的领域也一起成为热点,其中最主要的领域就是相对成熟的图像生成领域,最有名的有三个,一个是与Chat GPT同属Open AI公司的Dall-E2,另外两个是Midjourney和Stable Diffusion。这几个软件一经推出,立即吸引了广大用户,用这些工具生成的作品出现了爆发式的增长,也促进了这些软件的继续优化。
同时,采取同样算法的同类型软件也涌现出来。与生成图像相关的就是视频生成类软件,其主要做法就是利用图像生成工具生成一系列的图像后再将其连接成视频,由于图像间关联性目前还存在问题,所以这类软件不如单帧图像生成类软件成熟,其应用也还不够广泛,这类软件最突出的是Runway。
最后一类是音频生成类软件,语音识别作为人工智能最早涉足的领域之一,发展时间很长,所以语音生成类软件较多且相对成熟,应用不限于专业领域,像平时大家用到的“听书”类,微信的“在听”功能都是已经被广泛使用的文字转语音类工具。
AIGC类软件一经推出,就迅速成为热点和发展方向,目前在专业影视制作领域应用最广泛的是编剧辅助和美术概念辅助设计,随着技术的不断演进,我们应该会看到越来越多的工具出现。
AISGC
不像AIGC那么吸引人们的眼球,很多人其实都忽略了人工智能在影视制作领域的隐性应用,自从2012年深度学习赢得ImageNet的竞赛之后,计算机视觉借助人工智能取得了前所未有的飞速发展,并迅速进入应用阶段。
由于人工智能对计算机视觉技术的飞速提升,影视制作领域,尤其是后期制作中的各类工具得到了前所未有的增强。后期制作中最广泛使用的底层技术是数字图像处理,而这正是计算机视觉得以发挥其威力的“主要战场”。
当然也有一些支撑技术拓展出了新的领域,但是使用者往往不知道这是使用深度学习算法优化的结果,最典型的一个领域就是图像建模领域。
实际上,即使是在传统的影视制作领域,也有人工智能的“影子”,以影片调色为例,有两种调色方法几乎所有流程中都会涉及。
一种是通过公式进行不同系统之间的色彩空间变换,这常见于不同感光材料和现实系统的色彩管理中。这其实就是符号主义采取的策略——首先抽象逻辑规则,之后数学建模从而进行系统仿真。
另一种则是采取查找表的方式,这样的方式更加灵活,它可以被用于不方便用简单数学模型进行转换的色彩管理中,也可以用在同样系统中不同条件、不同风格中比较复杂的色彩变换中。查找表的方式就是典型的采用数据采样拟合的方式,这是连接主义得以发挥作用的领域。