什么是通用人工智能(General AI/AGI)

AI应用信息2年前 (2023)发布
1.9K 0

从古代神话到现代科幻小说,人类几千年来一直梦想着创造人工智能。但是,综合智能的努力直到 1950 年代后期才真正开始,当时十几位科学家聚集在新罕布什尔州达特茅斯学院,参加为期两个月的研讨会,以创造能够“使用语言、形成抽象和概念、解决各种问题的机器”。现在保留给人类,并改善自己。”

研讨会标志着人工智能历史的正式开始。但是,两个月的努力——以及随后的许多其他努力——只证明人类智能非常复杂,当你试图复制它时,复杂性变得更加明显。

这就是为什么尽管经过了 6 年的研究和开发,我们仍然没有能够与人类儿童的认知能力相媲美的人工智能,更不用说可以像成年人一样思考的人工智能了。然而,我们所拥有的是一个科学领域,它被分为两个不同的类别:狭义人工智能(ANI),我们今天拥有的,以及通用人工智能 (AGI),我们希望实现的目标。

AGI的要求是什么?

定义通用人工智能非常困难。“一般”已经暗示它是一个非常宽泛的术语,即使我们以人类智能为基准,也并非所有人都具有同样的智能。

但是,一般智能系统应该具有几个特征,例如常识、背景知识、迁移学习、抽象和因果关系。这些是你从小就在所有人类身上看到的那种功能。

了解通用 AI 系统可以做什么的最佳方法是提供一些挑战:

挑战 1:如果您将蝙蝠从场景中移开,接下来会发生什么?

这是一项挑战,需要人工智能了解物理动力学和因果关系。它还应该能够推理反事实,您对场景进行更改的替代场景。

什么是通用人工智能(General AI/AGI)

挑战 2:考虑以下文字,在Gary Marcus 和 Ernest Davis 的Rebooting AI 中提到:“Elsie 试图通过电话联系她的阿姨,但她没有接听。” 

谁没接电话?

Elsie 和她的阿姨在同一个房间吗?

这一挑战要求人工智能具备电话交谈的基本背景知识。大多数人都知道远程通信和电话的工作原理,因此他们可以推断出句子中缺少的许多内容,例如代词“she”的前因不清楚。

挑战 3:随机进入一间房子,煮一杯咖啡。加入一些牛奶和糖。

这一挑战需要人工智能代理对房屋结构有一个大致的了解。它应具备以下基本知识: 食物通常在厨房中找到。厨房通常位于房屋的一楼。咖啡储存在柜子里。牛奶必须放在冰箱里。AI 必须找到咖啡机,如果没有,它必须能够即兴发挥。大多数人下意识地解决了这些问题和其他几十个问题。

挑战 4:尝试按照以下顺序猜测下一张图片,取自François Chollet 的 ARC 数据集。

什么是通用人工智能(General AI/AGI)

虽然非常简单明了,但以通用方式解决这些挑战仍然超出了当今的 AI 系统。

以下是人工智能的两种主要方法,以及为什么它们不能单独解决人工智能问题。

符号 AI 与通用 AI

创建人工智能的早期努力集中在创建基于规则的系统,也称为符号人工智能。符号 AI 的前提是人类大脑操纵符号这一事实。我们有物体、人物、概念、状态、动作等的心理表征,我们使用这些表征(符号)来处理我们通过感官接收到的信息,对我们周围的世界进行推理,形成意图,做出决定,等等。

符号人工智能系统取得了早期进展。计算机编程语言是在符号操作的基础上创建的。您可以在每种编程语言中找到的类、结构、变量、函数和其他关键组件的创建使人类能够将符号转换为计算机指令。

但是符号人工智能有一些根本性的缺陷。只要您可以将任务的逻辑编码为规则,它就可以工作。但是,为智能的各个方面手动创建规则几乎是不可能的。

在 1980 年代,人工智能科学家尝试使用专家系统、基于规则的程序尝试这种方法,这些程序试图对特定学科(如医学)的所有知识进行编码。专家系统在非常狭窄的领域取得了成功,但一旦他们试图扩大其影响范围并解决更普遍的问题,就失败了。它们还需要计算机程序员和主题专家的巨大努力。

符号人工智能的另一个问题是它没有解决世界的混乱。一个例子是检测图像中的对象。计算机将视觉数据视为像素块,即表示图像上点颜色的数值。

图像中的每个对象都由一个像素块表示。使用符号 AI 解决这个问题的天真方法是创建一个基于规则的系统,将图像中的像素值与特定对象的已知像素序列进行比较。这种方法的问题在于,一个对象的像素值会根据它在图像中出现的角度、光照条件以及它是否被另一个对象部分遮挡而有所不同。

例如,考虑以下一组图片,其中都包含篮球。从图像中可以清楚地看出,每张照片中篮球的像素值都不同。在其中一些球体中,球的一部分被阴影遮蔽或反射强光。在一些图片中,球被球员的手或球网部分遮挡。然而在另一些情况下,线条和文字以不同的角度出现。球的大小根据它离相机的远近而变化。

要使用纯符号 AI 方法解决此问题,您必须添加更多规则:收集不同条件下不同篮球图像的列表,并添加更多if-then规则,将每个新图像的像素与您收集的图像列表进行比较. 但是,篮球在照片中的出现方式几乎是无限的,无论您将多少图像添加到数据库中,一个逐像素比较的严格的基于规则的系统都无法提供不错的物体识别准确度。

请注意,这是一个篮球,一个简单的球形物体,无论角度如何都保持其形状。现在想象一个更复杂的物体,比如一把椅子,或者一个可变形的物体,比如一件衬衫。任务的复杂性将呈指数级增长。

人工智能的历史和对人类智能的研究表明,符号操作只是通用人工智能的几个组成部分之一。

通用人工智能与机器学习

几乎与符号 AI 的研究并行,另一条研究重点是机器学习算法,即通过经验发展其行为的 AI 系统。

虽然机器学习算法有许多不同的风格,但它们都有一个相似的核心逻辑:您创建一个基本模型,通过提供训练示例来调整其参数,然后使用经过训练的模型来预测、分类或生成新数据。

机器学习最受欢迎的分支是深度学习,这个领域在过去几年受到了很多关注(和金钱)。深度学习算法的核心是深度神经网络,即层层叠叠的小型计算单元,当这些计算单元组合在一起并相互堆叠时,可以解决以前计算机无法解决的问题。

什么是通用人工智能(General AI/AGI)

一个深度神经网络由几层人工神经元组成

神经网络特别擅长处理杂乱的、非表格数据,例如照片和音频文件。近年来,深度学习已成为计算机视觉、语音识别和自然语言处理进步的关键。

回到上一节中提到的对象检测问题,下面是深度学习如何解决这个问题:首先,您创建一个convnet,一种特别擅长处理视觉数据的神经网络。然后,您在许多标有相应对象的照片上训练 AI 模型。最后,您通过提供新图像并验证它是否正确检测和标记其中包含的对象来测试模型。

深度神经网络不是逐像素比较,而是开发它们在训练数据中找到的模式的数学表示。与符号 AI 相比,神经网络更能适应图像中对象外观的细微变化。

但是深度学习能解决一般的 AI 问题吗?当然不是。迄今为止,神经网络已被证明擅长数据的空间和时间一致性。但是他们在概括自己的能力和像人类一样对世界进行推理方面非常差。

训练有素的神经网络可能能够检测到本文开头视频中的棒球、球棒和球员。但是很难理解场景中不同对象的行为和关系。神经网络在处理与训练示例在统计上不同的新情况时也会开始崩溃,例如从新角度观察对象。

一个巨大的语言模型可能能够生成一个连贯的文本摘录或将一个段落从法语翻译成英语。但是它不理解它创建的单词和句子的含义。它的主要工作是根据从数百万个文本文档中收集的统计数据预测序列中的下一个单词。

此外,在没有任何符号操作的情况下,神经网络在符号 AI 程序可以轻松解决的许多问题上表现非常差,例如计数项目和处理否定。神经网络缺乏您会在每个基于规则的程序中找到的基本组件,例如高级抽象和变量。这就是为什么他们需要大量数据和计算资源来解决简单的问题。

简而言之,符号 AI 和机器学习复制了人类智能的不同组成部分。但很明显,如果不整合所有部分,您将无法创建通用人工智能。

通用人工智能何时才能成为现实?

科学家和专家在破解人类级人工智能密码需要多少年的问题上存在分歧。但大多数人都同意,我们距离 AGI 至少还有几十年的时间。

尽管如此,作为 AI 社区的习惯,研究人员仍然顽固地继续前行,没有被 60 年未能实现创造思维机器的难以实现的梦想所吓倒。

今天,有各种各样的努力旨在推广人工智能算法的能力。同样,与人工智能中的许多其他事物一样,存在很多分歧和分歧,但一些有趣的方向正在发展。

一些科学家认为,前进的道路是混合人工智能,即神经网络和基于规则的系统的组合。他们认为,混合方法将结合两种方法的优势,帮助克服它们的缺点,为通用人工智能铺平道路。

其他科学家认为,纯基于神经网络的模型最终会发展出他们目前缺乏的推理能力。有很多关于创建深度学习系统的研究,这些系统可以在没有人类开发人员明确指导的情况下执行高级符号操作。该领域的其他有趣工作是自监督学习,这是深度学习算法的一个分支,它将学习以与人类儿童相同的方式体验和推理世界。

这些方法中的任何一种最终会让我们更接近 AGI,还是会发现更多的障碍和障碍?时间会告诉我们的。但可以肯定的是,在此过程中会有很多令人兴奋的发现。

    © 版权声明

    相关文章