2022年年底,ChatGPT的横空出世再次引发了市场对于AI的热议,而上一次全球范围内对AI产生大规模关注还是因为Alpha Go的出现。与Alpha Go不同的是,ChatGPT的出现将公众的视线带向了AIGC(人工智能生成内容)这一个人工智能的细分领域,让市场看见了AI进入生产生活的可行性。
AIGC是继PGC(Professional Generated Content,专业生产内容)和UGC(User Generated Content,用户生产内容)之后的一个新时代。在这个时代,“自然语言”与人工智能开始融合,通过人工智能技术实现内容生成,并在生成中注入了“创作”,意味着自然智能“独有”和“垄断”写作、绘画、音乐、教育等创造性工作的历史走向终结,开创了“模型”主导内容生成的时代。
在中国社科院技术经济学博士、科技加速器QAQ创始人杜雨看来,AIGC既是全民的风口,又是资本的风口,它将带来一场深刻的生产力变革,而这场变革也会影响人们工作和生活的方方面面。
他在新近出版的《AIGC:智能创作时代》一书中,从行业背景、技术思想、职能应用、行业应用、产业地图以及未来趋势六个角度深刻解读了目前AIGC行业的发展以及全景。
在最新访谈中,他还就公众关注的热点话题给出了答案,比如中国是否有能力做出类似与ChatGPT的产品。坊间普遍认为,中国在AIGC领域面临资金和优质训练数据不足的双重难题,但杜雨并不认为这两个问题真的存在。
围绕数据安全和隐私、新技术的伦理道德等以及由此给监管带来的挑战,杜雨也给出了他的看法。
以下为采访全文:
问:您认为ChatGPT的出现可以称得上是一个行业里程碑吗,是的话会为行业带来哪些改变?
杜雨: ChatGPT放在整个人工智能领域,无疑是一个颠覆性的里程碑。它不但在聊天能力上有了飞越,在文本处理这个领域也具有一定通用性,能够完成回答问题、翻译、写代码等多种任务。 此外,ChatGPT还表现出一些人类特质,例如承认自己的错误,按照设定的道德准则拒绝不怀好意的请求等。
正是因为它所具备的这种与人类相似的语言能力、强大的功能性,以及工程领域的进步性,让它拥有广阔的商业落地场景。可以与资讯、影视、游戏、教育、电商等多个行业进行结合,带来很多创新的机会和应用。
问:就目前来看,您认为ChatGPT的积极意义有哪些?
杜雨: ChatGPT带来的积极影响体现在很多方面:
(2)可能会变革当前的信息获取来源。过去,人们在互联网上查询信息主要是依靠搜索引擎来实现的。现在,在很多领域,ChatGPT可以替代搜索引擎的职能,或者提升搜索引擎本身的效果,例如微软就发布了集成ChatGPT的搜索引擎。并且,相较于搜索引擎,ChatGPT有诸多优势:它是信息检索-组织一体化的,搜索的同时就可以让ChatGPT将信息组织成想要的形式;它还有可以让用户享受到更良好的搜索体验,用户可以采用多轮聊天对话的形式来进行搜索,而不需要慎重的选择检索词的组合,并搭配检索式,这样也大大优化了用户的搜索体验。
(3)它也可以降低互联网内容的生产门槛。ChatGPT可以让在信息检索、内容组织、语言表达领域并不擅长、但具备创意的创作者发挥它创作的才能,降低各类内容的生产门槛。
问:以您对行业的了解,中国是否有能力做出类似与ChatGPT的产品?在这个过程中是否有什么难点?
杜雨: 百度的“文心一言”大模型就是与ChatGPT对标的典型代表。此外,阿里巴巴、腾讯、字节跳动也均对外表示正在推进中国版“ChatGPT”相关的研究与研发工作,十分值得期待。要打造中国版的ChatGPT的难点不光集中在技术实力上,也集中在资金实力上,训练是一件很烧钱的事情,所以目前也多是大厂宣布这块的布局。
杜雨: 我不认为中国面临“优质训练数据不足”的问题,因为:
第一、我们拥有最多的中文互联网用户和最繁荣的移动互联网生态,我们在移动互联网场景下积累的中文用户数据很充足;
第二、腾讯的微信和字节跳动的抖音是目前占据用户使用时长最多的应用,沉淀了每个网民每天最多的用户数据,因此无论是在图文(微信)还是短视频(抖音、快手)都有十分充足的优质训练数据,而且是独家的,据我了解腾讯不仅在公司层面有多个AI团队如 Lab,在微信事业群内部还有独立的AI团队;字节也更是有AI实验室;
第三、短视频已经相对于图文成为越来越主流的内容形态,因此短视频形态下的ChatGPT比当前我们所用到的文字版的ChatGPT更具想象空间。而在短视频形态下,字节跳动不仅在中国市场份额第一,TikTok在海外短视频软件市场中也占据最多的用户时长份额,意味着拥有比海外公司更多的训练语料。
问:目前已经有一些企业和个人开始使用ChatGPT开展商业活动并盈利,那么如果ChatGPT要进入大规模的商业运营,有哪些可能的场景和商业机会呢?
杜雨: 就目前来说,AIGC的身影已经在多个垂直领域中活跃,贯穿电商、教育、广告、游戏等多个行业。再具体一些来看,在运营商和产品营销中,ChatGPT可以充当智能AI客服;在课程社群管理中,可以作为群运营助手;在广告业里,可以帮助工作人员生成宣传语;游戏行业中,可以满足游戏内NPC对话的生成需求。
问:您之前提到了ChatGPT的出现可能会变革当前的信息获取来源,那么AIGC行业的发展对目前搜索行业的格局会产生什么影响?
杜雨: 搜索引擎这一项技术诞生很多年了,也到了更新换代的时候了,集成ChatGPT之类的AIGC工具可能会诞生出一些全新的搜索产品,比如微软集成了ChatGPT的搜索引擎新版本Bing就备受人们的关注,而前面也有很多媒体报道在看到ChatGPT的火爆后谷歌非常具有危机感。这种危机感来自于ChatGPT在作为搜索服务提供时具有很多优势: 它不仅能搜索信息,还能把信息组织成想要的形式,并且用户无需学习繁杂的检索词检索式就可以用自然的对话方式搜出想要的信息,大大优化了用户体验。
问: 现在很多观点认为,AI将成为新的经济增长引擎,您是否预估过AIGC产业的发展会为经济发展带来多大的增幅,或者说带来多少经济效益?
杜雨: 目前AIGC产业发展刚刚来到大规模应用的初期阶段,各个领域的应用开始喷涌式的出现,而从诞生初期到实现可观的经济效益会有一个过程,在这个阶段很难做出一个较为可靠的预估,但是AIGC 作为一种生产力角度的变革,未来能给经济发展带来的助力是有很大想象空间。
问:其实就目前AIGC的落地应用情况来看,AIGC可能还没有达到一个很成熟的商业化状态,有观点认为,如果AIGC要实现真正意义上的大规模商用,在技术必须要有更多的进步。您如何看待目前AIGC领域内的技术路径?未来是否会出现更合适先进的技术路径?还是目前的基层架构已经基本固化确定了?
杜雨:最初的AIGC通常基于小模型展开,这类模型一半需要特殊的标注数据训练,以解决特定的场景任务,通用性较差,很难被迁移,而且高度依赖人工调参。后来,这种形式的AIGC逐渐被基于大数据量、大参数量、强算法的大模型取代,这种形式的AIGC无须经过调整或只经过少量微调,就可以迁移到多种生成人物。
目前这一波浪潮主要是基于大模型的技术路径。但也许未来可能会出现其他方向也说不定。我们从GPT-1到3的时候,主要的迭代方式是不断扩大规模和增加训练数据量来实现的,所以当时很多媒体猜测GPT-4的时候会不会又在规模和训练数据量方面出现惊人的飞跃。不过从现在媒体报道的信息来看,未来的技术发展方向很大可能是多模态。
问:我们分析目前的产品可以知道,AIGC的模型需要进行大量的数据训练,这里面是否会涉及数据安全问题?
杜雨: 数据一直是机器学习模型的重要瓶颈,因为针对特定的任务场景,需要人工进行大量数据的标注才能让机器完成学习,许多业内专家将这种现象戏称为“人工智能就是大量打工才能换来的智能”。 但是数据安全的问题不在模型本身,而是在选取训练数据集的人或者公司。应该需要建立完善模型训练的数据审查机制,禁止一些违法渠道获取的数据被用于训练。从监管的角度上去考虑怎么解决可能设计的数据安全问题。
问: 当新技术出现时,通常都会面临一些技术道德问题,那么AIGC行业是否会产生伦理和道德困境?
杜雨: AIGC技术的发展无疑是革命性的。它可以改善我们的日常生活,提高生产力,但也面临着诸多技术伦理方面的挑战:
(1)版权问题:AIGC 本质上是机器学习的应用,而在模型的学习阶段,无法避免使用大量的数据集执行训练,但目前行业对于训练后生成物的版权界定相关法律体系仍不完善。从伦理上,有些AIGC工具可能会造成一些侵权行为但无法被清洗的界定。
(2)欺诈风险:AIGC生成的内容以假乱真。这项技术不仅可以用于篡改图像、视频等信息,更可以用于制造从未存在过的图像、视频内容。与此同时,这项技术的使用门槛也在不断降低,比如现在大家常用的社交媒体都具有一键轻松“换脸”“变声”等功能,从广义上来看都是AIGC的产物。由于契合人们“眼见为实”的认知共性,这项技术滥用后很可能使造假内容以高度可信的方式通过互联网即时触达公众,削弱大众对于虚假信息的判断力,使公众难以甄别真实和虚假信息。
(3)生成违禁内容:AI 生成的内容完全取决于使用者的引导,在安全措施并不完善的前提上,AI 针对恶意的诱导行为可能无法独立思考和判断,只能根据训练材料中学到的信息进行输出。基于 AIGC 技术的这个特点,可能会有使用者故意引导 AI 输出一些违禁内容,例如暴力、极端仇恨言论、色情图片等。
针对这些问题,科学家正尝试运用一些技术手段避免这些潜在风险的事件发生。通过改善数据集,增加更多的限制性条件,以及对模型进行微调,可以使得人工智能减少对于有害内容的学习,从而减少人工智能本身的危险性。除了从训练角度对AIGC潜在技术伦理问题进行预防外,在使用上及时告警停用的技术措施也很有必要。
问:您如何看待目前AIGC领域内的风险和监管?
杜雨: 前面我们提到的伦理和道德困境就是一些主要的风险,然后监管角度其实可以从这些角度思考:
(1)权利角度:版权归属于谁?训练数据集的作品创作者如何主张自己的权利?
(2)责任角度:如何防止AIGC用来作恶?(伪造内容、恶意内容、欺诈内容)作恶后追谁的责?是使用者、平台、直接监管责任人,还是内容传播方?
(3)监管态度:鼓励AIGC领域的创新,但对于一些容易作恶的领域要施加严监管。(例如出台规定深度合成业务需要严格的授权审核机制,并明确平台方的责任)
问:您如何评价目前中国的AIGC产业发展进程?
杜雨: 国内的AIGC可以说已经来到了大规模应用的前夜。一方面,我们看到像前面提到的百度这样的互联网大厂,推出了“文心一格”、“文心一言”这样的图像、文本领域的生成模型;另一方面,我们也可以观察到最近几个月,有许多优秀的AIGC初创公司在市场上涌现。相信在不远的将来,我们将在世界AIGC的舞台上,看到许多中国企业活跃的身影。
问:AIGC这个风口,您认为是一个全民的风口,还是资本的风口?
杜雨: 既是全民的风口,也是资本的风口。因为AIGC的技术每个人的生活和工作都可以涉及,每个人都可以享受到这一次技术带来的裨益,所以是全民的风口。而我们也可以看到国内众多的早期投资机构都开始关注AIGC领域,现在也渐渐出现了一些AIGC的投资案例,所以它也是资本的风口。