“当下,人工智能迎来一个难得的变革时期,这对于中国的学术界、产业界都是一个巨大的机会。大家应该有一个积极的心态来拥抱变化,因为技术不断向前发展是必然的。”
人物名片:
朱军,清华大学计算机系博世AI教授、IEEE Fellow、清华大学人工智能研究院副院长、计算机系人智实验室主任、生数科技创始人兼首席科学家。主要从事机器学习基础理论和高效算法研究。曾获中国科协求是杰出青年奖、科学探索奖、中国计算机学会自然科学一等奖、吴文俊人工智能自然科学一等奖、ICLR国际会议杰出论文奖等,入选国家级高层次人才计划、中国计算机学会青年科学家、MIT TR35中国先锋者等。
对话
1、sora问世,人工智能再度引发关注热潮,请问目前国内大模型技术发展到一个什么样的程度?
朱军:自Sora模型问世以来,全球多模态大模型领域的发展显著提速,国内更是走在世界前列。在Sora模型发布短短两个月后,国内大模型团队生数科技就联合清华大学推出了性能对标的“Vidu”模型,这标志着国内视频模型领域的一个重要里程碑,同时也为多模态技术的发展开辟了新篇章。如今,国内多模态大模型也正逐步走向产业落地,赋能影视、动画等领域,成为制作团队的重要技术工具。
除了赋能专业内容生产,随着模型推理性能的提升,未来多模态大模型还有望实现实时内容创作与交互。此外,多模态大模型的应用也不局限于传统的内容创作领域,还可以融入家居服务机器人和自动驾驶车辆等智能设备中,通过与环境交互生成数字内容,实现有机互动,为用户提供沉浸式体验。这些趋势充分展现了多模态大模型将能够同时在数字空间和物理空间为人类带来广阔的想象力和创造力。
2、AI生成影像的使用和传播越来越广泛,看上去也越来越逼真,那我们如何去辨别呢?
朱军:我们业内也非常关心和重视这方面的安全问题。国家层面也有相应的规划和部署,对生成式的内容进行管理和规范。现在AI生成的内容越来越逼真,单从视觉上肉眼很难区分,但是计算机很容易就能够进行识别。比如,目前的一个基本要求是对生成的内容打上水印,或制作数字水印注明出处,用户观看时不一定能直接看到,但通过技术手段就能检测出来。如此一来生成式的内容便于溯源也更加可控,将来也会有更好的途径来进行追踪。
我们一直致力于把安全的人工智能放在第一位,因为人工智能技术要想走向大众,要实现大规模使用,首先要解决安全问题。因此,内容安全、数据安全、数据隐私、模型算法安全等,都是我们关心的问题。
3、人工智能技术正快速发展,担心人被替代的声音也一直存在,我们应该如何更好地迎接人工智能时代的到来?
朱军:人工智能不是为了替代人,我们从事人工智能领域的目标也不是为了替代人,否则我们自己都可能被替代,但是人工智能技术的发展可能会替代那些不去了解、不去掌握人工智能技术的群体。因为人工智能技术的发展,就是为了辅助人更好地完成工作。当然这一过程中,一些高重复的机械性工作大概会很容易被机器自动完成,不需要人去重复性地劳作。换言之,当机器能帮我们完成这些重复性的工作时,那人一定有更高级的工作或更加创新的工作去做。
改变是一定发生的,因为每一次的技术进步都会带来关于替代人的这种讨论。但事实上在各种变革浪潮中,人是有非常强的适应能力和学习能力的。我相信人工智能技术不断提升,人也一定会找到更合适的定位,更好地利用工具来解决我们的问题。
当下,人工智能迎来一个难得的变革时期,这对于中国的学术界、产业界都是一个巨大的机会。大家应该有一个积极的心态来拥抱变化,因为技术不断向前发展是必然的。