摘要:
具身智能是指一种思想或者理论。它强调认知受智能体的感知与动作的影响,主张智能或智能行为来自智能体身体与周围环境的交互,而不仅仅是大脑的功能。这种思想与建立在笛卡尔身心二元论基础上的离身智能不同,后者没有考虑大脑与身体之间的联系。具身智能理论对认知科学、心理学、人类学、艺术等都产生了深刻的影响,由此诞生了具身认知、具身心理学等分支学科。当前,具身智能理论深入到大众关注的人工智能、机器人技术等领域,并产生重大影响。
推动人工智能迈向更高水平的通用人工智能
早期人工智能研究者认为,机器可以通过对符号的操作实现对人类思考(理性行为)的模拟,即让机器像人类那样思考,无需考虑身体和环境。他们把人工智能定义为模拟人类的智能行为,除了模拟思考之外,还包括感知、动作,以及情感与灵感等。由于他们认为思考和身体、环境是分离的,因此在模拟这些行为时,是各自独立进行,没有考虑行为之间的相互联系。人工智能的另一学派内在主义,主张人工智能应该模拟人类大脑的工作原理,我们通常称之为类脑计算。这个学派也没有考虑思考、感知与身体的关系。因此传统人工智能中的两大学派都属于离身智能。
具身智能则认为人类的智能行为不仅依赖大脑的思考,还需要通过与物理环境的交互来进行学习和决策,最后通过感知将执行的结果反馈到大脑,形成闭环,构成一个智能体,这样才能真正实现模拟人类智能行为的目标。具身智能这种思想的提出,与传统人工智能不同,将推动人工智能向更高的水平——通用人工智能发展。
人工智能的发展历史,经历过三个阶段。第一代人工智能提出以知识与经验为基础的推理模型,通过这一模型来模拟人类的思考。这一模型具有可解释性与可理解性的优点,但由于知识表示与获取的困难,该模型在应用和产业化上受到很大限制。第二代人工智能提出数据驱动的模型,通过基于大数据的机器学习,实现对人类感性和情感行为的模拟。由于模型的图像、语音等输入数据来自客观世界,因此具有很大的应用潜力,但由于模型本身存在不安全、不可靠、不可信(不可解释)、不可控和不易推广等缺陷,因此应用范围有限。虽然科学家在这期间也进行过模拟人类动作,比如手的操作与脚的步行等研究,但没有将这些研究与思考、感知等其他方面联系起来。总之,这两代人工智能都有很大的局限性,而且只针对特定领域、利用特定模型去解决特定任务。
2020年大语言模型的出现,把人工智能推向新的发展阶段——第三代人工智能。大语言模型具有强大的语言生成能力,使机器能够在开放领域下实现与人类的自由交互,这表明机器已经完全掌握了人类的语言。此事意义重大。正如哲学家维特根斯坦所言:“我的语言界限,就是我的世界界限。”机器一旦掌握了人类的语言,也就在某种程度上理解了人类的世界。大语言模型向通用人工智能迈出了关键一步。
尽管人工智能在语言生成上取得成功,在许多其他任务上还不能实现领域的通用性。比如医疗诊断,目前我们还没有开发出适用于各种疾病的计算机医疗诊断系统。另外,大语言模型只会说(生成语言),不会干(行动)。还有大量的任务,特别是复杂的任务,人工智能目前还无法完成。我们离真正的通用人工智能仍有一定距离,其原因就在于,传统人工智能对人类(大脑)的思考、感知与动作等方面的模拟是相互分开的,而且与环境隔离。具身智能则强调物理身体、环境感知与反馈的重要性,并通过它们实现与外部世界的交互。这正好弥补了传统人工智能的不足,使机器通过与环境的反复交互,逐渐学习适应环境并优化其决策和行动,不断迭代,完成更多、更复杂的任务,这就是新的学习范式——强化学习。由此可见,具身智能将使人工智能在更广泛的环境下,完成更多的任务,向通用人工智能迈进。
推动机器人领域三方面的技术进步
机器人的研究远在人工智能诞生之前。1954年,科学家发明数字控制可编程的机械臂,为现代工业机器人打下基础,也预示着现代机器人的真正诞生。在人工智能的发展过程中,虽然也将模仿人类动作纳入研究范围,但由于当时研究的重点是思考与感知,动作(身体)并没有受到很大关注。后来,机器人研究慢慢形成一个新领域——机器人学,与人工智能中的动作研究同时存在。机器人学研究的范围更宽,也更多关注技术、实际应用和产业化。1986年,移动机器人的先驱罗德尼·布鲁克斯提出了行为主义机器人学的主张,他认为传统的符号主义人工智能过于依赖复杂的推理系统,忽视了身体与环境的互动对智能行为的关键性贡献。可以说,这是在机器人领域首次提出具身智能思想。
总的来看,具身智能推动了机器人领域三方面的技术进步。
其一是推动机器人技术从单一感知(如视觉或触觉)向多模态感知发展。自动驾驶汽车需要在各种气候条件和复杂环境下行驶,全天候的环境感知极为重要。目前除了利用单一的摄像机之外,人们更多地考虑多传感器融合,即除摄像机之外,还要综合利用激光扫描仪、雷达、声呐、卫星定位等不同传感器,以保证感知的可靠性。同样,对机械手来讲,也需要利用触觉、力觉、力矩觉等多传感器的融合,以便在复杂环境下实现复杂操作,比如,装配、抢险救灾、排雷等。
其二是推动机器人技术更加关注软件与硬件的高度整合。为了适应不同工作任务的需求,我们需要设计不同类型的机器人,如为家庭服务的人形机器人,拥有灵巧双手的装配机器人,拥有特殊功效的仿生机器人等。不同类型的机器人需要不同的控制技术,也会导致不同的学习和感知方式,这反过来又影响机器人形态的设计。这些都属于机器人软硬件协同的问题。
其三,具身智能中的智能体概念对机器人技术也将产生重要影响。根据智能体这一概念,机器人将思考、感知和动作连为一体,既可以在数字世界中也可以在物理世界中完成任务,利用数字世界又可以对物理世界进行仿真,这些对推动机器人的发展意义重大。比如,无人车的实验如果在物理世界中进行,就要受到气候条件、突发事件等诸多因素限制,利用仿真模拟则会大大提高效率,节省时间与费用。利用智能体理论,我们可以让机器人相互之间进行博弈,实现机器的自我进化(迭代),使机器人的性能不断提高。
(作者为中国科学院院士、清华大学教授)