​迪斯尼是如何把情感融入一个小机器人的?—— 融合动画和强化学习的生动表现

图片

大数据文摘受权转载自机器人大讲堂
在2023年IEEE/RSJ 智能机器人与系统国际会议(IROS)上,迪斯尼研究院的一个团队在底特律的晚间主题演讲中介绍了一个全新的机器人角色。这个机器人拥有儿童大小的身躯,却能表现出丰富的情感,从它活泼灵动的头和两个摇摆的天线“触角”,到它短短的小腿,会让人觉得十分可爱。但这个机器人与其他小型双足机器人的不同之处在于它的行走方式——“充满个性,边走边发出声音,让人觉得它是独一无二的小生命。”
新系统让机器人展现更多表现力
迪斯尼在动画制作方面非常有经验,早在1971年,迪斯尼世界的总统大厅就采用了动画机器人技术。然而,随着机器人变得越来越先进和机动性更强,对于机器人设计师和机器人动画师来说,开发既实用又与真实世界的限制条件相兼容的情感化行为越来越难。 
在过去的一年中,迪斯尼研究院开发了一种新系统,该系统利用强化学习将动画师的想象转化为具有表现力的动作。据悉,这些动作足够强大,几乎适用于任何场地,无论是在智能机器人与系统国际会议(IROS)上、迪斯尼主题公园中,还是瑞士的森林里。并且,这个新系统可以使机器人表现出更多情感和表情,使它们在不同场合中更具吸引力和实用性。         
图片
图片
这个特定的机器人是由苏黎世的迪斯尼研究院的莫里茨·巴赫领导的团队开发的。它主要是通过3D打印制造的,采用了模块化的硬件和执行器。这种设计使得它的开发和改进速度非常快,从最初的概念到最终的样子,不到一年的时间就完成了。它有一个四自由度的头,可以上下左右看,还可以倾斜。此外,它还有一条带有髋关节的五自由度腿,使它能够在动态平衡的同时行走。这使得机器人能够进行更多复杂的动作和交互,具有更高的灵活性。     
图片
图片
巴赫解释说:“一般来说,动画工具中没有内置物理引擎,这使得艺术家很难设计出在现实世界中能够正常运行的动画。” “这不仅仅是关于行走。行走只是强化学习系统的输入之一,但另一个重要的输入是它的行走方式。”研究人员补充道。
为了弥补这一差距,迪斯尼研究院开发了一种基于强化学习的系统。该系统依靠仿真技术将动画师的视觉与强大的机器人动作结合起来,并在两者之间取得平衡。对于动画师来说,这个系统能够基本上重现物理世界的约束,让动画师开发出极具表现力的动作。这些艺术家想象中的动作能够变为现实,且尽可能接近机器人的物理极限。迪斯尼的流水线可以在一台个人电脑上训练机器人的新行为,只需几个小时就能完成相当于数年的训练。据巴赫的说法,这让迪斯尼开发一个新机器人角色所需的时间从几年缩短到了几个月。   
图片
此外,强化学习让小机器人产生的动作具有很强的鲁棒性。迪斯尼研究院开发的这个系统能够反复地训练动作,同时对电机性能、质量分布以及机器人与地面之间的摩擦力等方面进行细微调整。该系统能够确保机小机器人无论在现实世界中遇到什么情况,都知道如何处理自己同时还能表现出对应的情感,这对其保持自己的个性至关重要.
结合动画师与机器人专家的力量传达情感
大多数机器人专家都专注于让他们双足行走的机器人能够可靠地行走,迪士尼研究院的科学家摩根·波普说。在迪士尼,这可能还不够——我们的机器人可能必须通过行走、跳跃、潜行、慢跑或漫步等方式来传达我们需要的情感。“我们试图给这些类型的机器人带来源于我们角色动画的历史,”迪斯尼首席研发工程师迈克尔·霍普金斯解释道。“我们有一位出色的动画师贾里德·毕晓普,他加入了我们的团队,我们一起利用他的知识和我们的技术专长创造最好的表现。”

图片

摩根·波普(左)和莫里茨·巴赫在2023年的IROS上展示了这款新机器人。
要创造一个有效的机器人角色,需要动画师和机器人专家将他们的才能结合起来,这个过程可能需要花费大量时间,并且需要进行很多次尝试和犯错,以确保机器人能够传达动画师的艺术意图而不会摔倒。“一般来说,动画工具没有内置物理学,”巴赫解释道。“这使得艺术家很难设计出在现实世界中可行的动画。”    
“这不仅仅是关于行走,”波普补充道。“行走是强化学习系统的一个输入,但另一个重要的输入是它如何行走。”
为了弥补这一差距,迪士尼研究院开发了一条基于强化学习的流水线,它依靠模拟来将动画师的视觉与机器人的动作相结合和平衡。对于动画师来说,这条流水线基本上负责实现物理世界的约束,让动画师在依靠系统使这些动作逼真的同时开发高度富有表现力的动作。迪士尼的流水线可以在一台PC上训练机器人新的行为,在短短几个小时内完成相当于数年训练的内容。据巴赫解释,这使得迪士尼开发新的机器人角色的时间从几年减少到几个月。
         图片
在这种情况下,强化学习的一个很大优势是产生的动作可以高度稳健。迪士尼的系统能够在反复训练动作的同时,对机器人的一些东西(如电机性能、质量分布和机器人与地面之间的摩擦)进行微小的改变。该系统确保无论机器人在现实世界中遇到什么,它不仅知道如何控制自己,而且知道如何在保持其角色的同时控制自己的情绪。
“这是传统技术的挑战,”迪士尼研究院的副研究员鲁文·格兰达说。“通常,你必须手动编程这个过渡点。但是如果你把所有的东西都放在一个模拟中,当它试图移动和动画时对其进行扰动,它可以自己确定那个点。”             
社交机器人新篇章:迪士尼研究中的情感交流与形态多样
社交机器人已经存在了几十年,即使不是专门为社交互动设计的机器人,如果它们可能会和人类共处,通常也会有一些人机交互功能。但人机交互有时会被主要设计功能所忽略。迪士尼的机器人展示了机器人如何在不牺牲功能性的情况下通过角色进行交流,这在更广泛的机器人领域中是有用的。“在人类和机器人紧密相处的情况下,传达情感和意图可以是一个重要的特征,”迪士尼高级研发想象师Georg Wiedebach解释说。“所以我认为,当机器人与人类一起工作时,这也可以在其他应用中发挥作用。”
图片
研究人员强调,这里重要的不是机器人,而是过程。“这个想法是一个硬件不可知的平台,”巴赫说。“如果我们想要增加更多的腿,或者增加手臂,或者创造一个完全不同形态的新角色,我们可以迅速地教授它新的行为。现成的执行器、3D打印的组件、我们自适应的强化学习框架都可以应用于在外观和运动方式上存在很大差异的机器人。这个机器人是这一旅程充满希望的的第一步。”
迪士尼接下来的步骤包括使用这种技术来开发更多的实体机器人角色,并推动更快更动态运动的极限。“我们想看看当我们达到这些极限时会发生什么,”迪士尼研发科学家Espen Knoop说,“并学习我们能在这些极限中做什么。”   
图片
至于这个机器人,这个角色还没有正式的名字,迪士尼也没有透露我们可能会在哪里看到它。但是基于它的外观和声音,大家猜测这个小小的机器人只是开始。