谷歌和OpenAI开启新一轮AI竞赛 科技巨头接下来咋走?

AIGC行业资讯7个月前发布 zhang
9 0

在2022年至2024年的科技浪潮中,ChatGPT犹如AI领域的璀璨明星。这一时期,人工智能AI)技术如同火箭般疾驰,以前所未有的力量重塑着世界的每一个角落。从智能移动设备到个人计算平台,再到智能驾驶系统,AI的渗透力和影响力无处不在。

在这场技术革新的竞赛中,Open AI、谷歌微软等科技巨头竞相角逐,纷纷亮剑。它们不仅在算法和模型上持续迭代优化,更在应用场景上不断探索。

谷歌和OpenAI开启新一轮AI竞赛 科技巨头接下来咋走?

与此同时,手机市场也在AI技术的驱动下焕发出新的活力。随着Android 15、iOS 18的即将到来,以及小米、华为等国内厂商在AI领域的积极探索,智能手机将实现更加智能化、个性化的功能。同时,PC市场也在AI的助力下焕发新生,联想、苹果华为、荣耀等厂商纷纷推出AI PC产品。

作为当红炸子鸡的智能汽车也正在成为AI技术的新载体。汽车行业正由“软件定义”迈向“AI驱动”,通过集成先进的AI技术,实现更加智能、安全的驾驶体验。而在这一切变革中,英伟达凭借其卓越的GPU和无与伦比的AI计算能力,成为了无可争议的“最大赢家”。

在“AI”重塑这个世界的当下,CNMO推出了“AI重塑ing”系列专题,本文围绕的点是“新一轮AI竞赛中科技巨头的走向”。

谷歌和OpenAI开启新一轮AI竞赛 科技巨头接下来咋走?

5月份,三大科技巨头OpenAI谷歌微软不约而同发布了AI新产品,但各自的侧重点有所不同。OpenAI重点介绍了GPT-4o,它有点像科幻电影《她》中的人工智能女性,除了处理日常的工作和需求,还能满足人的情感需要。谷歌发布了十多项产品更新和新品,更像是“AI全家桶”。微软也是一口气发布了50多项更新,包括从AI基础设施的搭建到模型产品的落地。

Open AI——转向AI手机助手

OpenAI抢先谷歌一天发布了GPT-4o,它比以前任何大模型都更像人,似乎预示着人工智能与人类情感交互的新时代即将到来,这点可能是其它科技巨头的大模型不具备的。GPT-4o的发布,还表明OpenAI有向消费电子领域,尤其是向手机助手市场靠拢的想法。

GPT-4o的核心在于实现人机交互的无缝对接和对人类情感的深入理解。通过跨文本、视觉、音频的端到端训练,GPT-4o消除了传统模型转换的延迟,对话如同真人交流般流畅自然。

谷歌和OpenAI开启新一轮AI竞赛 科技巨头接下来咋走?

GPT-4o最引人注目的特点是对“情绪价值”的捕捉与反馈。它能从用户的语音细微变化中解读情绪状态,进而提供适时的建议或反馈,如引导用户深呼吸以缓解紧张情绪,甚至能通过用户的面部表情判断心情并做出相应回应,这是AI向具备情感智能方向发展的重要标志。

OpenAI的下一步棋是让GPT-4o的能力触及终端,从B端市场向C端消费市场扩展,苹果可能就是最重要的桥梁。据彭博社报道,苹果即将与OpenAI达成一项协议,将ChatGPT的能力整合进iPhone。根据这份协议,苹果将在未来发布的iOS 18中使用ChatGPT功能。目前双方谈判仍在进行中,协议尚未最终达成。站在苹果的角度,当整个手机行业都在向更高级别的智能交互模式转变时,它也不得不做出改变,所以与OpenAI的合作想必会顺利很多。

谷歌——分销才是王道

这几年谷歌在AI领域被OpenAI抢了风头,但其实谷歌算是OpenAI的一个加强版,因为它不仅在AI领域有着深厚的技术积累,更有着无可比拟的分销优势。Gemini可能成不了最好的AI模型,但有可能是用户最常用的。其最新发布的Gemini 1.5 Pro提供了一个拥有百万token的超长上下文窗口模型,支持35种语言,覆盖全球150多个国家和地区,为用户提供前所未有的长文本理解和处理能力。

谷歌的打法是要守住AI搜索,同时也要向未知的领域拓展。

在最新Gemini的加持下,谷歌搜索引擎将迎来多维度逻辑推理的强化,能够一并应对包含多重约束的复杂查询,为用户提供一站式的问题分解与创意激发服务,并且首次融入视频搜索功能,使用户能够通过上传视频来寻找问题的答案。作为全球最大的手机操作系统厂商,谷歌能够轻而易举将这项技术推广至全球超十亿用户。

谷歌和OpenAI开启新一轮AI竞赛 科技巨头接下来咋走?

谷歌的Project Astra项目是对抗OpenAI GPT-4o的重拳。Astra利用Gemini模型的多模态能力,实现了通过摄像头和语音命令进行实时环境分析和互动,展示了AI从虚拟助手向更全面生活伴侣的进化。在情感表达和响应速度上,它与GPT-4o尚有差距,但能用就行。谷歌计划逐步将Astra功能融入Gemini应用和产品矩阵中。

在AI生成内容的浪潮中,谷歌的Veo是对OpenAI Sora的直接回应。Veo能够基于文本、图像和视频提示生成高清视频内容,用户可根据个人偏好定制视频风格,只是具体发布时间未定,仍然是个期货。

谷歌在新一轮AI竞赛中比较重视全场景布局。从Gemini的广泛分销策略,到Project Astra的实用化探索,再到Veo的创意生成和底层技术的不断迭代,谷歌正构建一个由AI驱动的未来生态,其中既有对现有优势的深化加固,也有面向未来的探索。谷歌的战略不仅关乎技术的领先,更在于如何让这些技术“变现”。

微软——找准自身定位

与上述两个AI巨头相比,微软的AI战略始终是围绕企业生产力进行的。微软近期的一系列动作,尤其是“Copilot+PC”系列的发布与Team Copilot的亮相,都表明其在B端市场的深耕决心。

5月20日,微软推出的“Copilot+PC”系列,特别是新款Surface Pro,将AI技术深度融入个人电脑,号称“史上最强、最智能的Windows PC”。

谷歌和OpenAI开启新一轮AI竞赛 科技巨头接下来咋走?

紧接着,微软在2024年Build开发者大会上,推出了Team Copilot,这是微软AI战略向B端市场延伸的又一步棋。从个人助手到团队助理的转变,Team Copilot通过集成在Teams、Loop、Planner等工具中,不仅能主持会议、管理项目进度,更深层的意义在于优化团队协作流程,减少沟通成本,提升工作效率,直击企业痛点。

微软自定义ChatGPT构建工具Copilot Studio新增的Agent功能,为企业提供了高度定制化的AI解决方案。企业可以根据自身业务需求,打造出能够独立处理复杂流程的智能助手,如自动管理电商平台订单。

微软在模型研究上的投入同样不容忽视,Phi-3模型系列的推出,特别是涵盖文本、图片乃至多模态输入的多样化模型,不仅丰富了开发者的选择,也降低了AI应用的门槛,使得更多企业能够便捷地利用AI技术优化产品和服务。

面向个人用户做AI产品并非微软的优势,以提升生产力为核心的“打工人”与B端市场战略现在是微软的重中之重。无论是智能PC的革新、Team Copilot的推出,还是在模型构建工具、多模态模型以及数据分析平台上的创新,都是微软在探索AI与工作深度融合路径上的重要一步。

写在最后

无论是个人还是这些科技巨头,谁也无法预测AI最终会给人类带来怎样深刻的改变,AI的浪潮太大了,大到让人看不清方向,Meta算是前车之鉴。对于所有投身于AI竞赛的企业来说,找准自身定位,明确战略方向,将AI技术与自身优势结合,以解决实际问题为核心,或许才能在瞬息万变的洪流中稳舵前行。

    © 版权声明

    相关文章