科普漫谈:什么是具身人工智能?

具身式人工智能使机器人和自主无人机能够与现实世界互动,但它是如何工作的呢?

图片

人工智能(AI)有多种形式,从模式识别系统到生成式AI。然而,还有另一种类型的人工智能几乎可以立即对现实世界的数据做出反应:具身式人工智能(Embodied AI)。

但这项技术到底是什么,它是如何工作的呢?

具身式人工智能通常将传感器与机器学习相结合,以响应现实世界的数据。例子包括自主无人机、自动驾驶汽车和工厂自动化。机器人吸尘器和割草机使用了一种简化形式的具身式人工智能。

这些自主系统使用人工智能来学习如何在现实世界中克服障碍。大多数具身人工智能使用算法编码的地图,在许多方面类似于伦敦出租车司机使用的迷宫般的道路和地标网络的心理地图。事实上,关于伦敦出租车司机如何确定路线的研究已被用来为这种具身式系统的发展提供信息。

其中一些系统还包含了在昆虫群、鸟群或动物群中发现的具体化的群体智能。这些群体下意识地同步他们的动作。模仿这种行为是开发由具身式人工智能控制的无人机或仓库车辆网络的有用策略。

具身人工智能的历史

具身人工智能的发展始于20世纪50年代,由英国伯顿神经学研究所(Burden Neurological Institute)的威廉·格雷·沃尔特(William Grey Walter)创造的控制论乌龟(cybernetic tortoise)。但具身人工智能的发展需要几十年的时间。认知和生成人工智能从大型语言模型中学习,而具身人工智能从其在物理世界中的经验中学习,就像人类对所见所闻做出反应一样。

然而,具身人工智能的感官输入与人类的感官有很大的不同。内置的人工智能可以检测X射线、紫外线和红外光、磁场或GPS数据。然后,计算机视觉算法可以使用这些感官数据来识别物体并对其做出反应。

构建世界模型

具身式人工智能的核心要素是它的世界模型,它是为它的操作环境而设计的。这个世界模型类似于我们对周围环境的理解。

世界模型是由不同的学习方法支持的。其中一个例子是强化学习,它使用基于策略的方法来确定路线 —— 例如,使用“遇到y时总是做X”这样的规则。

另一种是主动推理,以人类大脑的运作方式为模型。这些模型不断地从环境中获取数据,并基于实时流更新世界模型 —— 类似于我们基于所见所闻做出的反应。相比之下,其他一些人工智能模型并没有实时进化。

主动推理始于对环境的基本理解,但它可以迅速发展。因此,任何依赖主动推理的自动驾驶汽车都需要经过广泛的培训才能安全上路。

具身式人工智能还可以通过阅读客户的情绪状态并相应地调整其反应,帮助聊天机器人提供更好的客户体验。

虽然具身式人工智能系统仍处于早期阶段,但研究正在迅速发展。生成式人工智能的改进自然会为具身人工智能的发展提供信息。具身式人工智能还将受益于其用于确定周围环境的传感器的准确性和可用性的提高。


如果朋友们喜欢,敬请关注“知新了了”!