Sora让“一句话生成视频”成为可能，AIGC全面介入各个场景，未来的创作由谁定义？

AIGC行业资讯1年前 (2024)发布管理员

Sora让“一句话生成视频”成为可能，却也让不少内容创作者感到担忧——未来，AIGC（生成式人工智能）技术会彻底取代人类成为文化产品的创作主体吗？当AIGC全面介入，人类的创造力会随之变得薄弱吗？届时，人们引以为傲的“创意”与“灵感”又是否需要被重新定义呢？

记者邀请同济大学人文学院艺术与文化产业系教授解学芳、清华大学新闻与传播学院副院长张铮，共同探讨当AI深度介入文化生产，我们所面临的变局、抉择与应对之法。

AI的再度“进化”

周末周刊：您还记得第一次看到Sora生成的作品时的情景吗？当时是什么感觉？

解学芳（同济大学人文学院艺术与文化产业系教授）：第一次看Sora生成视频时还是有点震撼。没想到，在如此短的时间里，人工智能模拟现实物理世界真实场景的强大能力已经提升至新的发展阶段。

我印象最深刻的片段是第一支放出来的长达60多秒的视频——一位时尚女性涂着明艳的口红，穿着黑色皮夹克上衣、红色长裙与黑色短靴，戴着墨镜，既悠闲又充满自信地走在潮湿的街道上，身后则是布满霓虹灯牌的东京街道夜景和各色时尚着装的行人……这段视频呈现出影视大片的既视感，也代表着Sora在模拟仿真现实物理世界的能力不断提升。

张铮（清华大学新闻与传播学院副院长）：其实，在ChatGPT问世之后，已经有很多企业在进行AI内容视觉化的探索了。当时有业界专家预测，未来三年左右会有能形成比较连贯的成熟的画面的生成工具，没想到Open AI不到一年半的时间就交出了Sora这样一份答卷。我个人觉得，在当前人工智能快速发展的领域，人类的预判很可能失效。

周末周刊：但在这之后，Sora还是犯了些常识性错误。比如，在考古现场凭空出现一把悬浮的塑料椅子，人物跑动方向与跑步机履带传送方向相反等。

解学芳：从内容生产的角度看，其实不论是ChatGPT还是Sora，我们都能或明显或模糊地感受到一定的“拼凑感”。

这一方面是由于机械式创作，AIGC模式下人工智能的生成能力所产生的“幻觉”会模糊人类创意与机器填充之间的边界。“真实”常常是伴随着不完美的，AIGC会过于追求“精确”，从而缺乏不完美的真实性。另一方面，主体性情感的缺失则会让人感到这些作品有些许“空洞”，尽管Sora中的人物在基本动作、基础表情上能自如展示，但在眼神、微表情等需要传递深层含义的领域尚有进步的空间。

张铮：我认为这里的问题需要分开来看。首先，我们必须承认，Sora作为一款产品，它的确存在某种程度上的进步空间。但产品本身的局限，只能代表某一技术路径在目前阶段的局限，并不足以由此对AIGC未来的能力加以判断。

人类的认知水平是随着科技的发展在不断提升的。现在的人们看到文艺复兴时期的人们笃信“地心说”，甚至愿意为此牺牲时，只会感叹时代的局限性，但绝不会质疑人类的认知能力。这就是我想说的——受限于多种因素，AIGC目前的技术水平并不能完全与人类作品的质量齐平，但我们要做好充分的思想准备，那就是，未来有一天，AI做出来的内容将与人类做出来的别无二致，甚至更好。

周末周刊：未来，AIGC还会有突破性的进展吗？其主要发展方向可能会有哪些呢？

解学芳：未来，AIGC模式可能会以“全知全能”的形象介入多个应用场景。其中影响最大的依然会是新闻信息、图文设计、小说等领域，包括文学作品、绘画、短视频、游戏乃至长视频、影视制作等文创内容的生成；而在内容运营和传播智能化领域、数字人与人形机器人领域、元宇宙内容生成等方面，AIGC也都将有所突破。

张铮：我个人比较期待AI在创意生成上的突破。从20世纪50年代发展至今，AI的算法已经经历过几次迭代，其中，生成式算法到2014年才诞生。也是在这个算法问世后，人工智能才进入自主创作阶段。因此，一个新的算法，完全有可能带来AI在文化生产力上质的飞跃。

另外，我期待大模型+小模型的组合能诞生个性化AI。在文化创作领域，我们不仅需要基础性工作，更需要将不同领域的信息融会贯通，形成个性化的思考和表达。未来AI是否能真正成为一个输出独特创意的工具，这是我更关心的问题。

重塑产业，明晰边界

周末周刊：目前，AIGC已经部分地进入了人们的日常生活。据统计，抖音和小红书有约5%~10%的内容为AI创作，一旦AIGC全方位介入人类的文化生产领域，会带来哪些影响？

解学芳：首先肯定重塑内容生产的范式，特别是Sora文生视频大模型的出现，标志着内容生产方式的根本变革。Sora能够生成60秒长，包含多角色、精确动作和复杂故事背景的模拟现实视频，这超越了传统的文本和图像生成。并且，Sora模型的背后是深度理解和仿真功能，结合深度学习和3D世界模型生成技术，这对短视频、动漫、影视和游戏等广义上的视频行业都带来了颠覆性的变革。

其次，人类在内容生产中的角色也将发生转变，将从纯粹的内容生产者变成“元编辑”——即智能机器和算法的设计者、训练者、规范者，以及作品的构思者、把关者。以2022年斩获美国科罗拉多州博览会美术竞赛一等奖的《太空歌剧院》为例，创作者杰森·艾伦通过文字标签生成了900多个作品，再利用Midjourney（一款AI绘画工具）对这些作品由好到坏进行排序，以此建立标签数据集并用于训练奖励模型，最后再择优进行修改。

最后，这也将给文化行业的就业结构带来挑战。AIGC技术的应用正动摇着文化创意行业的就业稳定性。单纯的灯光、布景、设计、剪辑等相对简单重复的工作岗位可能会被取代，企业也可能因此减少对文创人才的需求。这种变化虽然在短期内可能导致就业结构的动荡，但从长远来看，也为行业带来了高效率和创新的可能性。

张铮：当利用AIGC技术的文化产品大量进入市场，我们还需要面对一个重要的问题，就是如何去评估和衡量此类文化产品的价值，如何判断人在其中所承担的工作和价值。

显而易见，在AIGC技术的帮助下，许多文化产品参与创作的人数减少，生产环节压缩，生产成本下降，生产周期缩短……一旦这些内容生产所需的生产要素发生改变，我们对其价值的评判标准也应该随之发生改变。那么，所谓高概念、大制作、巨星参演的“大片”是否还有生存空间？流量明星与文化产品高度绑定的生产模式是否还能奏效？现有文化产品生产流程中的这些分工方式、分配方式是否依然合理？这些问题都值得考量。

另外，我认为AIGC技术的文化产品供给越丰富，现实艺术表演的价值就会越高。作为文化产品，“稀缺性”一定是消费者花钱的重要考量。而这里的“稀缺”指的是，在同等质量的情况下，现场能给消费者提供不一样的体验感。

周末周刊：目前，算法中的潜在侵权行为也在不断发生。AIGC在赋能数字文化生产的同时，会成为风险的源头吗？

解学芳：AIGC以互联网数据的海量“投喂”为基础。然而，迄今为止，人类共出版约1.29亿本书，其中，完成数字化的仅12%（约1500万本），而上传到互联网以供免费获取的数量更为稀少，再加上机构为了规避侵权所带来的风险而排除的内容，即使是ChatGPT引以为傲的1750亿个参数，也不过是人类文明中的沧海一粟。

这导致AIGC能“吃”到的东西很有限，训练数据的数量和多样性都存在缺陷。另外，训练数据的质量和其内在价值并不能被一一审查、筛选，因此AIGC所面临的价值观风险依然很高。

另外，多数AIGC模型采用的深度学习算法，是直接从事物原始特征出发，自动学习和生成高级认知结果的“黑箱”学习法，其内部结构和运作过程缺乏透明度，这有可能造成非故意的“深度伪造”，并由此引发数字文化生产的“失控”。

张铮：我的想法略有不同。我主张“先发展，后治理”。事实上，我们所担心的AI可能带来的许多问题目前都还没有发生。纵观历史，人类是在不断发现错误、纠正错误的过程中成长起来的，而依照人类的思维学习模式所创造的人工智能是否也可以获得“试错”的机会呢？当我们将每一个风险点，看作AI技术调整的起点和契机，“技术恐慌”或许就能少一点。

文化生活的新图景

周末周刊：AIGC技术的发展降低了内容创作的门槛，这在一定程度上能够解放大众精神生产力和文化创造力。一旦这种生产力和创造力被解放，我们的生活将是一个什么样的场景？

解学芳：AIGC技术实现了文字、图像、音视频等内容场景的自动化智能化生成，将文化内容生产从PGC（专业生产内容）模式、UGC（用户生成内容）模式跃至AIGC（利用人工智能技术生成内容）模式时代。从文化产品的规模上来讲，AIGC带来了智能文化新质生产力，将为我们打造一个文化内容更加丰富、文化产品更加富足、文化生活更加多彩的未来生活新图景。

另外，越来越多的人可能会成为数字文化生产中的行动者。举个例子，世界上最大的多人在线游戏创作平台Roblox就在探索在Roblox Studio中搭建AIGC平台，用语音、文字、触摸手势等“傻瓜式”便利工具替代鼠标和键盘，为创作者提供更低门槛、更自然直观的创作环境，将想象力转化为创意。这也意味着，文化产品的“创意浓度”将进一步增强。

张铮：随着深度数字化的发展，社会生活中的景象与物质，同虚拟空间的“孪生物”“映射物”的联系也将愈加紧密。以苹果公司新发布的头戴式VR设备Vision pro为例，人们可以扫描复制现实生活中的物体，并将其摆放到自己的虚拟空间中进行“二创”。

一旦现实与虚拟的边界被打通，人们的文化生活场景就可以有更多可能。体验感和沉浸感将成为文化产品生产中的重要一环。届时，人们不仅可以创造电影、游戏等虚拟文化产品，甚至将虚拟和现实相互融合，为人们带来全新的、沉浸式的多感官体验的作品。

周末周刊：另一方面，创作门槛的降低是否也会带来一些挑战？

张铮：最明显的变化，可能就是文化产品供给侧和需求侧的不平衡。一方面，内容的持续创意和产能正攀上一个新的台阶，文化供给的能力将持续增强；另一方面，文化产品消费者则变得越来越挑剔和难以“讨好”。

这里或许存在一个发展模式的转型，即从创作者经济到认同者经济。未来的文化生产不能仅仅埋头于“创作”，而需要更多地将文化消费人群纳入文化生产的流程之中，以重视“认同”为核心的需求侧逻辑，发展个性化、定制化的文化产品服务……从某种角度来看，这反过来又提高了文化产品的创作门槛。

解学芳：创作门槛的降低会让AIGC变得愈加触手可及。当使用者只需要提供“语言口令”就可以完成创意工作时，人变成“机器”的可能性也将增加。

弗洛姆曾说：“过去人们面临的危险是变成奴隶，而将来的危险则是变成机器人。”AIGC越精进，人类对其的依赖程度就越深，人的创造力、行动力和审美力就越有可能因为懒惰而退化，甚至有可能会主动放弃自身在文化生产上的主体性地位，让文化领域被AI全面接管。因此，如何在接受技术赋能的同时，自觉抵抗技术带来的“异化”风险，将是未来创作者非常重要的素养之一。

周末周刊：有人认为，生成式AI最重要的功能是“人类增强”，它能极大地缩小所谓内行“精英”与外行“小白”之间的能力差距，但这似乎也同时瓦解了人类学习、追求进步的意义。

解学芳：随着人工智能技术的普及，当越来越多的创作者开始借助人工智能进行创作，“精英”与“小白”之间一般意义上的差距缩小了，但整体社会的结构性差距变大了，或者说，数字难民和数字鸿沟增加了——一旦掌握AIGC内容生产能力，就掌握了新质生产力；反之，则增加了数智时代数字难民的规模。

此外，创意阶层的“人”的情感表达很可能越来越稀少，在AIGC模式下文化内容创作易陷入对现有文化资源重复使用的循环而缺乏原创性创新，长期会制约人的主体性创新。

例如，基于ChatGPT等大语言模型进行内容生产，创作者不再是情感的表达者与故事的生产者，而成为文字的批量生产者，这是优质文学作品匮乏的主要原因之一。

基于此，文科学习的内容也确实发生转变，加快在文科思维中融入数据思维、技术思维、伦理思维的交叉融合创新成为新趋向。正如尤瓦尔·赫拉利在《未来简史》中的判断：“目前最耐人寻味的新兴宗教正是‘数据主义’，它崇拜的既不是神也不是人，而是数据。”

破除“数字崇拜”

周末周刊：AIGC内容的生成是基于人类的“prompt”（提示词）而完成的。网络上很多人喜欢将“prompt”叫作“咒语”，似乎AI已经成为某种“魔法”，而生产者们只有精准掌握“prompt”这一密码，才能达成自己的目标。这对于今天的人文社科教育而言，是否可以看作一个新的机会？

解学芳：文森特·莫斯可在其《数字化崇拜》一书中强调：“技术只有摆脱了神话般的偶像崇拜，才能真正成为社会和经济变迁的动力。”

Sora出现后，立刻受到了人们的热情追捧。但热闹过后，我们应该认识到，不该盲目地对某项数字技术进行神话般的偶像崇拜，而应更加客观更加理性地看待AI的迭代与发展。“prompt”看起来只是简单的自然语言，但语言文字本身承载着人类文明发展中的智慧与能量，文字正是“道”的载体，也是我们与技术沟通必不可少的桥梁。

客观上讲，ChatGPT诞生后，对于精准生动的prompt的重视确实揭露出文科教育在知识体系和理论建构方面的重要性。例如，设计专业特别重视技术工具类的课程体系，以帮助学生快速掌握设计工具以实现就业的目标。但AIGC时代来临，意味着工具性人力资源的可替代性越来越高，但理论、概念、创意等知识体系的建构性能力则无可替代。从这个意义上而言，文科发展既面临新机遇，也面临AI时代带来的新挑战。

周末周刊：在数字时代，我国的文科教育应该如何回应这些新需求？我们是否已经开始了这方面的探索？

张铮：在清华大学，人和AI协同发展的探索已经开始，并且不局限于文科教育。这两年，清华大学以“千亿参数多模态大模型GLM”为平台与技术基座，研发出多个AI助教系统，在热力化工学、城市建筑学等多个学科进行试点。

在人文学科方面，我院的沈阳教授一直担任“元宇宙发展与挑战”这门选修课的任课老师，一直鼓励他的学生利用AI进行各种创作，包括完成作业等。去年，他和他的团队利用AI创作了一部科幻小说，名为《机忆之地》，并在第五届江苏省青年科普科幻作品大赛中获二等奖，引发了人们对于AI创作的关注和讨论。

今年，AI将在教学中得到更大范围的利用。在前不久的全校教职工大会上，清华大学宣布，会建设100门人工智能赋能教学试点课程，并为2024级新生配备“AI成长助手”，每一位新生都将直面人工智能，体验“人机协同”的校园生活。

解学芳：一方面，面对以ChatGPT为代表的生成式人工智能在“拟人化认知互动”层面的创新性表现，文科人才培养的重点将是数据思维、技术思维与创意思维、文化思维的协同，从而确保人类引以为傲的原创能力与情感表达能力。

另一方面，对于人才培养的关注点应更加聚焦创意和创新思维的培养，更加注重知识体系和理论体系的建构，以及建构AIGC科技伦理观。

不久前，荷兰开源调查媒体“响铃猫”网站的创办人艾略特·希金斯，利用Midjourney将美国前总统特朗普可能被捕的新闻可视化，帖子在两天内的浏览量达到了500万次。尽管标注了是AI生成图片，但仍在未被标注的情况下被大量转载，引发失范现象。这意味着，在文科教育方面，不管是AIGC开发者、运营者，还是使用者都应该加快建构起数智时代的科技伦理观，既防止新型安全问题增生，也促进数智技术可持续健康发展。

AIGC时代的到来意味着，从“数字移民”走向“人工智能移民”的过程中，蕴含着认知方式与价值逻辑的深度转换，加快培养迎合时代巨变，拥有数据思维、技术思维、数字素养、人文思维、数据伦理观以及中国式理论建构能力的综合型新文科人才至关重要。

# AIGC行业资讯