我们都知道作为人类,一个人对信息的判别和过滤,很多人连网络上各种虚假信息都不具备真假的辨别能力,我们跟AI对话当中得到的信息,我们怎么知道它是真是假,这是目前的一个很大的问题,而这个问题至少在目前的ChatGPT技术架构上是无法解决的,同时,因为它现在整个模型的知识,官方说截至2021年,假设实时的新产生的知识它不知道的时候,必然有一些时效性的知识它是有可能“胡说八道”的,所以,当AIGC产生的大量内容和人类产生大量的内容,融合在一起的时候,在很大程度上,你是很难很快去区分的,不管是文字还是图片。
第二,我们可以在产品上,把一些实时的结果跟ChatGPT的对话结果融合在一起,就像谷歌前几天的发布会,虽然它的Bard在发布的时候回答错了一些问题,但是实际上,如果说我们真的去用ChatGPT就知道,ChatGPT回答错的问题更是多了去了,所以我不认为谷歌的技术就比不上OpenAI,做不出类似的东西,反而是因为它的搜索覆盖的用户群过于巨大,它在产品上做一个小的修改,很有可能会引起数以亿计的用户习惯的改变,以及影响到它数十亿美金的收入,所以它和OpenAI的地位是不太一样的,它必然就会束手束脚,这是一个很重要的原因。
总的来说,AIGC实际上已经进入生产,已经可以满足我们低阶的需求,但是要看你怎么用,实际上我知道的一些团队,包括我所在的团队,都已经把AIGC的内容导入了工作流,做某个方面的优化,我相信很多的AIGC的产品,它现在在辅助人类的工作,以及替代人类的局部工作,这个现象已经在产生,而历史的车轮是不可阻挡的。
如果只是生成单一的内容,那么AIGC或许还不至于让见多识广的大众眼前一亮,而多模态大模型的出现,让融合性创新成为可能。
多模态大模型,既需要具备NLP(自然语言理解)大模型,CV(计算机视觉)大模型等的能力,理解语言,视觉的内容,还要能够跨模态生成全新的内容,由此带来了非常多的创意空间,比如通过一部小说的文字描写,生成故事画面,人物形象,环境布景等,可以帮助创作者大大节省时间。
正因如此,多模态大模型需要处理的数据类型多,规模量大,模型参数已经达到千亿级别,需要庞大的算力来支撑,得益于多地对AI基础设施的重视和建设,才能够让多模态应用达到比较好的效果,进而支撑AIGC创作业态的进一步发展。