主 持 人:《金融时报》记者 胡萍
特邀嘉宾:马上消费金融公司人工智能研究院院长 陆全
奇富科技增长产品部高级总监 戴会杰
生成式人工智能(AIGC)的蓬勃发展被认为是一场不可逆转的技术革命,为千行百业开启了崭新的想象空间。今年,人工智能文生视频大模型Sora的出现又引发大家对大模型变革的思考,技术的日新月异会给金融行业带来什么?
《金融时报》记者:您认为Sora的先进性体现在哪些方面?
陆全:从画面上来看,Sora的效果细腻度和连续性远超Pika、Runway等知名同类产品,它有一条创新的技术思路。之前的视频生成产品用的都是扩散模型,而Sora是把大语言模型和扩散模型结合在一起,提出了一个“世界模拟器”的概念。Sora理解了人类语言的基础之后,模拟了我们这个世界的模型,了解了我们这个世界的知识,从而使得大语言模型和扩散模型结合在一起,能够模拟物理世界的物理定律。比如,在Sora生成视频里,它能像人一样理解纸飞机碰到树会掉下来,汉堡被人咬了一口会剩下半个汉堡。
《金融时报》记者:您认为这一新技术的运用会产生怎样的影响?
陆全:Sora将大大加快AGI(通用人工智能)的进程。OpenAI训练Sora应该会利用多模态的能力来理解和压缩海量的视频,多模态的能力和大语言模型能力相结合,它对视频的理解就不仅仅是一些画面的叠加。Sora在模型训练中,“观看”并“理解”了所有的互联网视频和电影。一幅图胜过千言万语,而视频传递的信息量远远超过一幅图,所以Sora训练需要的算力规模以及它内部压缩的知识量应该会远远超过GPT-4。
《金融时报》记者:AIGC对金融业有何影响?
戴会杰:营销是最快与AIGC结合并产生实际落地效果的领域之一。大模型的进入,很有可能为当下受困于流量、效果和成本的营销工作提供新的解法。现阶段的大模型已经渗透到生产、质检、效果评价的每个环节中。一个机构的过往营销素材和营销活动所带来的结果都能够被AI充分学习和分析。单独投放一个素材能出现爆款的概率微乎其微,但是如果投放1000个素材,爆款概率将大大提升,而大模型正是通过扩大产能来保证效果。比如,一个设计人员过去一天只能做出100张图片,而如今,通过大模型却能轻松生成1000张图片。在视频制作方面,大模型的价值更为凸显。
陆全:Sora大幅提高生成视频的质量,在金融业务上可以降低营销、培训视频的生成成本。Sora还能驱动数字技术的更新换代,带来更好的客户体验,为全行业带来降本增效的效果。
更重要的是,我们在金融市场更要学习的是Sora这种深入研发、深入应用的决心和勇气。Sora的成功不仅是技术的成功,也是一种创新思维的成功。它告诉我们自然语言指令标注和有业务属性的优质数据之间的有机结合,能够打通各类客户交互和业务需求的联系,对金融业务和场景进行全面的模拟,产生新的智能产品和新的智能场景,在通用人工智能的道路上走得更远。
《金融时报》记者:大模型用于营销拓客环节,如何评判或确保其效果?
戴会杰:从我们的实践看,客户触达规模能够提升超20%。在大模型的使用过程中,首先要做的是素材标注,即给素材贴上各种标签,以便将素材分解成易于理解的要素,方便后续进一步分析和筛选;要建立多维度AI评级体系,对素材的标准符合度、人气指数、投放效果等进行评分;通过标注和评级的双重机制,提升大模型等科技的使用效能。
行业大模型并非单纯追求技术突破,而是顺应各行各业的特性,积极探索成本效益的最佳优化方案。对技术的探索要聚焦于解决具体问题,通过技术创新突破场景困境,正是这种实践将赋予大模型在金融行业未来无限的可能。