AI行情又卷土重来,CPO概念、光通信模块、AI芯片、AIGC、储存芯片等多个细分领域纷纷上涨,直接的原因是近日谷歌发布的AI多模态模型Gemini1.0和美国AI初创公司Pika labsAI发布的AI文生视频软件Pika1.0,热度席卷全网。
据悉,作为多模态大模型,Gemini可以同时识别和理解文本、图像、音频、视频和代码五种信息,且对信息的理解非常精准,其包含三个版本:Ultra、Pro、Nano,Nano可以在移动端侧离线运行,Pro可实现更高级的推理和规划,功能最强大的Ultra明年初对外开放。
而Pika1.0能够生成和编辑3D动画、动漫、卡通和电影,且制作视频门槛较低,用户只需要输入一句话,就可以生成想要的各种风格的视频,并通过简单的描述,更改视频中的形象和风格。Pika1.0的功能包括:文本生成视频、图像生成视频、视频风格转换、对视频内容进行编辑。
目前,多模态已成为生成式AI重点发展方向。不少券商认为以Pika1.0和Gemini为代表的AI多模态模型不断突破,或推动大模型在工具、教育、办公、电商、营销等领域的应用加快落地并打开商业化空间。
AI大模型持续迭代升级,多模态是主要趋势!
2022年11月末推出的ChatGPT让AI大模型逐步进入大众视野,风靡全球,国内外厂商也纷纷推出自己的AI大模型,模型的算力和参数量也在加速迭代升级,OpenAI在2023年3月15日左右推出了多模态大模型GPT-4,支持接受图像和文本输入,以文本形式输出,开创了多模态大模型的时代。
目前,国内外各家厂商也把目光放在了多模态大模型上,对标GPT-4开发竞品。相比于单模态,多模态AI能够实现基于文本、语音、图片、视频等多模态数据的综合处理应用,完成跨模态领域任务。多模态模型的核心是处理和整合不同类型的数据源,可以捕获跨模态的复杂关系,使机器能够更全面地理解和分析信息,从而在各种任务中表现得更好,多模态将成为主要趋势。
据浙商证券研报,AI模型走向多模态必然性的三大因素是跨模态任务需求+跨模态数据融合+对人类认知能力的模拟。据悉,它以模态融合为核心技术环节,围绕“表征-翻译-对齐-融合-联合学习”五大技术环节,解决实际场景下复杂问题的多模态解任务。
图片来源:浙商证券研究所
现阶段大语言模型的竞争已经非常激烈,在OpenAI的技术方向引领下,目前语言模型的技术路径基本就是GPT这一条路。
但是,在多模态技术方面,并没有一家公司处于绝对领先地位,技术路径仍存在探索的可能。不过,于12月6日谷歌推出的多模态模型,宣称其已经超越了OpenAI的GPT-4,谷歌官方表示,Gemini经过了当前LLM(大型语言模型)领域中广泛使用的32个基准测试,在其中大部分基准测试中,表现出了“最先进的性能”,不仅击败了OpenAI的GPT-4,甚至在MMLU(大规模多任务语言理解)基准测试中,成为第一个超越人类专家的模型。
从技术突破的角度来看,东方证券发布研报也认为,下一阶段的重点攻克方向必然会是多模态技术。能够真正处理和应用好多模态AI能力,才能真正打通物理世界和数字世界的障壁,用最基础的感知世界能力直接生成操作,实现与物理世界最自然的交互。
多模态AI应用想象空间广阔,相关概念股曝光!
文生视频模型Pika走红和谷歌Gemini的发布,表明了AI应用领域的巨大想象空间,在多模态发展趋势明确,以及大模型能力持续迭代下,中国AI产业的空间或将加速打开。
根据《2023年中国AI技术变革企业服务白皮书》,2022年,中国AI大模型市场规模达到891.2亿元,随着AI技术的成熟和在各行业中的广泛应用,预计到2027年,市场规模将增至2777.5亿元,年均增长率为25.53%。
图片来源:2023年中国AI技术变革企业服务白皮书
随着AI大模型进一步朝多模态方向升级,AI多模态技术有望带动游戏、社交、教育、医药等领域应用落地,商业化增量空间或将不断打开。其中,AI应用软件的市场空间将不断扩大,据市场分析机构IDC最新报告显示,2022年全球AI应用软件市场规模为640亿美元,预计到2027年将增加到2790亿美元,复合年增长率(CAGR)为31.4%。
笔者根据Choice数据、券商研报、上市公司公告等筛选出了多模态AI应用核心A股概念股,供读者参考。
风险揭示:本文所涉及的内容不保证数据完整性与准确性,分析结论仅供参考,所涉及品种均不构成实际投资操作建议。股市有风险,投资需谨慎。本文所涉的文章观点,仅代表笔者个人观点,不代表本平台的任何立场,不构成任何投资建议。
版权声明:未经许可,任何个人或机构不得进行任何形式的修改或将其用于商业用途。转载、引用、翻译、二次创作(包括但不限于以影音等其他形式展现作品内容)或以任何商业目的进行使用的,必须取得我司许可并注明作品来源为私募排排网,同时载明内容域名出处。