9月10日周二,据知名科技商业类媒体The Information援引多位测试过该模型的人士透露,站在时代风口浪尖的“AI宠儿”OpenAI计划在未来两周内发布名为“草莓”的最新人工智能产品,作为ChatGPT所提供服务的一部分。这比两周前传闻的“秋季发布”(9月至11月)要更早。
上述报道称,专注于推理能力的人工智能“草莓”发布前后还有一些亟待解决的问题,但看似“仓促上马”似乎说明OpenAI感受到了大语言模型驱动产品领域的激烈竞争压力,希望通过近几个月被市场期待已久的草莓项目,来恢复ChatGPT首发以来两年里大部分时间的势头。
何为“草莓”模型?专注于推理能力,是人工智能下一个重大突破
具体来说,“草莓”模型凭借增强的推理能力,能够更好地处理令以往AI模型“挠头”的复杂科学和数学问题,不仅能让大语言模型(LLM)根据用户的复杂查询生成答案,甚至还能提前规划,以便自主、可靠地浏览互联网,进行OpenAI 定义的“深度研究”(deep research)。
评论普遍认为,OpenAI的“草莓计划”有望成为人工智能下一个重大突破。更先进的推理能力意味着该技术可以“自主”执行更复杂任务,而不仅仅是依靠用户的逐步提示行事。推理一直是AI在类人智能追求中最棘手的问题之一,而具有推理能力的人工智能模型不仅能改善数学和编程能力,还可以彻底改变科学研究,增强医疗保健和金融等复杂领域的决策力,并加速技术创新。
会显著更贵吗?“草莓”模型具体的提供形式和定价模式尚不确定
与常规的对话式人工智能不同,“草莓”在回应用户的提示语之前会“思考”10到20秒,而不是立即给出答案。对于复杂或包含多个执行步骤要求的查询语,“草莓”将比现有的GPT-4o版本更易于使用,不需要用户明确告知ChatGPT“完成中间推理步骤以得出最终答案”等额外举动。
有分析称,这意味着“草莓”将成为更加智能的助手,不仅在解决数学问题和编码方面表现更佳,在更“主观”的商业任务方面也更优秀,比如集思广益制定产品营销策略等。而且在这类偏创意的任务中,该模型将提供更针对用户公司需求、更详细的建议,比如生成每周执行计划。
不过,假设发布一切顺利,在初始版本“草莓”只能接收和生成文本信息,而不能接收和生成图像,这代表不像其他OpenAI模型那样具备“多模态”功能,算是“缺点”之一。
同时,尽管“思考”阶段有助于避免AI犯错、且能预测如何全面回答用户问题,但有测试过该模型的人士称,一些简单问题也会令草莓“思考”而无法迅速给出答案;答案质量仅略佳,不值得额外等待;而且有时无法在回答新问题之前记住并整合与用户的先前聊天记录。
“草莓”模型为何重要?或重新定义AI能力边界,为GPT 5提供高质量合成训练数据
OpenAI首席执行官奥特曼(Sam Altman)曾在今年早些时候表示,人工智能领域“最重要的进步方向将是推理能力”。
而“草莓”项目被认为就是去年披露出的OpenAI“Q*”计划,该项目在公司内部已被视为一项突破。观看过演示的人称能够回答当前商用AI模型无法解决的棘手科学和数学问题。
OpenAI曾在8月11日给出了未来AI发展的五个阶段路线图,第一阶段便是现在具有对话语言的AI聊天机器人,第二阶段是具有人类水平问题解决能力的“推理者”,第三阶段是可以采取自主行动的“代理人”(ai agent),随后是可协助发明的“创新者”和可完成组织工作的“组织者”。
而“草莓”极可能是帮助OpenAI实现第二级AI的关键,一旦成功将重新定义AI的能力边界,自主执行复杂任务、独立解决复杂问题并验证输出内容,代表人类离通用人工智能AGI又进一步。专注于推理的“草莓”可能也是为下一代AI模型“猎户座”或者说ChatGPT 5奠基的必经之路。
软件开发机构Technology Rivers创始人兼CEO Ghazenfer Mansoor指出,借助“草莓”项目,OpenAI对人类推理水平的追求不仅是技术奇迹,更能突破界限、激发每个领域新的可能性。比如在商业领域,人工智能将能极大地改变供应链的管理方式,非常准确地预测市场趋势,并在很大程度上使客户体验非常个性化。
总而言之,在理想化的情况下,“草莓”将能够解决超出当前人工智能模型能力范围的问题和任务,并进行“深入研究”,“比任何现有的聊天机器人都更胜一筹”。
还有分析指出,“草莓”计划旨在筹集更多资金,OpenAI需要这笔钱来支持代号为“猎户座”的下一代前沿模型开发。而且,为“猎户座”模型生成高质量的合成训练数据被认为是“草莓”的关键应用之一,“这一点意义重大,因为互联网上的大部分训练数据都已被使用殆尽”:
人工智能模型所依赖的大型数据集可能容易出现偏差和错误,或者包含不完整或不准确的信息。草莓计划生成的高质量合成数据可以填补现实世界数据集的空白,并提供更全面、更包容、更平衡的训练集。
许多人认为,使用合成数据可以帮助未来的人工智能模型更加中立和公平,并减少噪音、幻觉和不相关的信息,从而提高训练的效率和模型的准确性。
根据已知的信息,草莓计划改进了推理、逻辑以及规划和开展研究的能力,可以让模型自主进行实验、分析数据并提出新的假设。这可能会带来科学突破,包括发现新药。这些模型还可以提供个性化教育,创建教育内容和互动课程。
据知情人士透露,“草莓”项目包括一种专门的“后训练”方法,即生成式AI模型已经过大量数据集上进行预训练后,进一步调整模型以提高其在特定任务上的表现。这类似于斯坦福大学在2022年开发的“自学推理者”(Self-Taught Reasoner,简称STaR)方法。
STaR创造者之一、斯坦福大学教授Noah Goodman曾表示,STaR可以让AI模型通过迭代创建自有训练数据,“引导 ”自己进入更高的智能水平,理论上可用来让语言模型实现超越人类的智能。但他也承认,“这既令人兴奋又令人恐惧,人类(应就自身处境)需要认真思考一些问题了。”