多模态AI成新“风口”？AI应用端大爆发！多模态AI应用概念股曝光

AIGC行业资讯1年前 (2023)发布管理员

AI行情又卷土重来，CPO概念、光通信模块、AI芯片、AIGC、储存芯片等多个细分领域纷纷上涨，直接的原因是近日谷歌发布的AI多模态模型Gemini1.0和美国AI初创公司Pika labsAI发布的AI文生视频软件Pika1.0，热度席卷全网。

据悉，作为多模态大模型，Gemini可以同时识别和理解文本、图像、音频、视频和代码五种信息，且对信息的理解非常精准，其包含三个版本：Ultra、Pro、Nano，Nano可以在移动端侧离线运行，Pro可实现更高级的推理和规划，功能最强大的Ultra明年初对外开放。

而Pika1.0能够生成和编辑3D动画、动漫、卡通和电影，且制作视频门槛较低，用户只需要输入一句话，就可以生成想要的各种风格的视频，并通过简单的描述，更改视频中的形象和风格。Pika1.0的功能包括：文本生成视频、图像生成视频、视频风格转换、对视频内容进行编辑。

目前，多模态已成为生成式AI重点发展方向。不少券商认为以Pika1.0和Gemini为代表的AI多模态模型不断突破，或推动大模型在工具、教育、办公、电商、营销等领域的应用加快落地并打开商业化空间。

AI大模型持续迭代升级，多模态是主要趋势！

2022年11月末推出的ChatGPT让AI大模型逐步进入大众视野，风靡全球，国内外厂商也纷纷推出自己的AI大模型，模型的算力和参数量也在加速迭代升级，OpenAI在2023年3月15日左右推出了多模态大模型GPT-4，支持接受图像和文本输入，以文本形式输出，开创了多模态大模型的时代。

目前，国内外各家厂商也把目光放在了多模态大模型上，对标GPT-4开发竞品。相比于单模态，多模态AI能够实现基于文本、语音、图片、视频等多模态数据的综合处理应用，完成跨模态领域任务。多模态模型的核心是处理和整合不同类型的数据源，可以捕获跨模态的复杂关系，使机器能够更全面地理解和分析信息，从而在各种任务中表现得更好，多模态将成为主要趋势。

据浙商证券研报，AI模型走向多模态必然性的三大因素是跨模态任务需求+跨模态数据融合+对人类认知能力的模拟。据悉，它以模态融合为核心技术环节，围绕“表征-翻译-对齐-融合-联合学习”五大技术环节，解决实际场景下复杂问题的多模态解任务。

图片来源：浙商证券研究所

现阶段大语言模型的竞争已经非常激烈，在OpenAI的技术方向引领下，目前语言模型的技术路径基本就是GPT这一条路。

但是，在多模态技术方面，并没有一家公司处于绝对领先地位，技术路径仍存在探索的可能。不过，于12月6日谷歌推出的多模态模型，宣称其已经超越了OpenAI的GPT-4，谷歌官方表示，Gemini经过了当前LLM(大型语言模型)领域中广泛使用的32个基准测试，在其中大部分基准测试中，表现出了“最先进的性能”，不仅击败了OpenAI的GPT-4，甚至在MMLU(大规模多任务语言理解)基准测试中，成为第一个超越人类专家的模型。

从技术突破的角度来看，东方证券发布研报也认为，下一阶段的重点攻克方向必然会是多模态技术。能够真正处理和应用好多模态AI能力，才能真正打通物理世界和数字世界的障壁，用最基础的感知世界能力直接生成操作，实现与物理世界最自然的交互。

多模态AI应用想象空间广阔，相关概念股曝光！

文生视频模型Pika走红和谷歌Gemini的发布，表明了AI应用领域的巨大想象空间，在多模态发展趋势明确，以及大模型能力持续迭代下，中国AI产业的空间或将加速打开。

根据《2023年中国AI技术变革企业服务白皮书》，2022年，中国AI大模型市场规模达到891.2亿元，随着AI技术的成熟和在各行业中的广泛应用，预计到2027年，市场规模将增至2777.5亿元，年均增长率为25.53%。

图片来源：2023年中国AI技术变革企业服务白皮书

随着AI大模型进一步朝多模态方向升级，AI多模态技术有望带动游戏、社交、教育、医药等领域应用落地，商业化增量空间或将不断打开。其中，AI应用软件的市场空间将不断扩大，据市场分析机构IDC最新报告显示，2022年全球AI应用软件市场规模为640亿美元，预计到2027年将增加到2790亿美元，复合年增长率(CAGR)为31.4%。

笔者根据Choice数据、券商研报、上市公司公告等筛选出了多模态AI应用核心A股概念股，供读者参考。

风险揭示：本文所涉及的内容不保证数据完整性与准确性，分析结论仅供参考，所涉及品种均不构成实际投资操作建议。股市有风险，投资需谨慎。本文所涉的文章观点，仅代表笔者个人观点，不代表本平台的任何立场，不构成任何投资建议。