从“滞空”到打拳:刚体的柔性幻觉(附讨论)

作者 | 邵 青  教育管理学博士、旅美学者、企业家


春晚舞台上,宇树机器人的武术表演引发了广泛兴趣。它给很多人的直觉是,机器人越来越像人了,但这个感觉很容易引起误解。事实上,舞台上呈现的,并不是机器获得了对动作的“理解”,而是工程系统正在用越来越复杂的方式,去掩盖它作为一个刚性结构的物理本性。换句话说,我们看到的并非“智能”的跃迁,而是“控制工程”的阶段性成功。


如果把注意力从表演效果移开,真正有技术含量的问题其实是原本由刚性组件和离散连接构成的系统,为什么能够表现出看上去如此“柔性”的动作?这不是审美偏好,而是一个关于物理结构与控制代价的工程实践。


图片


滞空”争论与“人非刚体”


其实,此类问题并不新奇。记得上个世纪八十年代,人们曾就优秀排球运动员汪嘉伟的“滞空”动作出现过一些争论。不少观众觉得汪嘉伟起跳在空中时似乎“停住了”,而另一些观众则认为这不可能,因为它违反了物理定律。当时我就曾提出过一个简单但关键的解释,人不是刚体。所谓“滞空”,并不是质心真的停止下降,而是运动员在空中通过摆臂、收腿、展体、收腹等一系列动作,不断重排身体各部分相对质心的位置,给观众视线所追踪的身体关键部位留下停滞和下降缓慢的感觉,从而产生“停在空中”的视觉印象。


物理定律从未被突破,被改变的只是我们的感知参照。关键不在于“看起来像什么”,而在于非刚体系统可以通过姿态重构,持续改写外界对运动节奏的判断。这正是生物身体天然具备、而工程系统必须付出巨大代价才能模拟的能力。


生物的柔性来自结构


从生物力学角度看,人类身体是一个高度复杂的非刚体系统。肌肉、筋膜和软组织天然具有顺应性与粘弹性,关节也并非理想的铰链结构。许多稳定性并不是“算”出来的,而是由材料和结构本身被动提供的。大量看起来“自然”的动作,实际上是结构冗余与形变自由度的副产品。


而今天大多数人形机器人,本质上仍然是多刚体系统的组合:刚性连杆、离散关节、精确编码器。结构本身几乎不给“柔性”任何免费空间,稳定性主要依赖传感器、模型与控制回路的持续工作。甚至可以说,生物的自然感主要来自结构,机器的自然感主要来自计算。差别不仅在风格,也在目的。比如有的系统用计算去对抗最坏的物理环境,有的系统则用计算去制造可复制的“生物感”效果。


刚性系统如何“模拟”非刚体效果


也正因为如此,让机器人看起来像人一样自然地舞动,这在工程上本身就是一件与其物理本性对抗的技术实现。舞台上呈现的流畅、连贯与“柔和”,并不是材料意义上的柔,而是通过全身动力学规划、力矩级控制、阻抗与顺应控制等一整套复杂机制,在一个高度刚性的系统上模拟出来的效果。


如果借用当年优秀排球运动员汪嘉伟滞空动作的逻辑来看,本质是一致的。这里不是系统真的变成了非刚体,而是通过姿态的不间断的计算性合成,改变了我们感知到的运动节奏。通过手臂摆动、躯干扭转和下肢协同,机器人可以在视觉上“修饰”重心变化的突兀感,让动作不再像分段拼接的机械执行,而更接近我们对生物运动的直觉预期。这种“像人一样”的观感,本质上是一种被精密计算出来的工程效果。


极限控制与工程复制


把这次展示放到更大的坐标系里,就会看到一条经常被忽略的分野。以波士顿动力(Boston Dynamics)为代表的一类系统,长期追求的是在最坏条件下依然成立的运动能力,比如强扰动、非结构化地形、不可预期接触。在那里,“像生物一样动”更多意味着鲁棒性与泛化能力,它不强调在舞台上完成一套优雅、舒展动作,而是在碎石、斜坡、推搡与踩空中仍能保持平衡和稳定。这条路线的终极目标,是想不断抬高刚性系统在现实世界中的物理上限。


视频源于新京报我们视频出品(ID:wevideo)


与之相比,宇树这次展示所代表的,是另一种同样严肃、但目标不同的工程取向,即在可控条件下,把“非刚体效果”做得足够稳定、足够便宜、足够可复制。它不以“最坏情况”为中心指标,而以“可部署性、可复现性、可规模化编排”为优先约束。换句话说,这不是要证明刚性系统还能多“肆意”,而是要证明它已经可以被当作一种工程模块,稳定地输出“看起来像生物”的运动表现。春晚舞台上的表演,显然属于后者。


这两条路线并不存在谁对谁错的简单对立。前者更接近在定义“可能性的上限”,后者更接近在推进“工程现实的前沿”。但正是这个差异,使得同样是“刚性系统逼近非刚体效果”,在技术含义上出现了分叉:一条通向极端环境中的鲁棒控制,一条通向社会场景中的可复制部署。


工程实现的代价与边界


从这个角度看,宇树这次展示真正困难的地方,并不在于“会不会表演武术”,而在于如何让一个刚性多体系统在连续动作中尽量“显得不那么刚体”。这意味着,控制系统必须持续补偿结构层面的先天不足,把本该由材料与形态承担的那部分“柔顺性”,转化为实时计算与反馈调节的结果。


图片


这是一项昂贵而精细的工程成就,但它的代价也同样清晰,即系统对模型精度、传感质量和控制频率的依赖极高。一旦环境出现非预期扰动,脆弱性就会迅速显现出来。生物的动作之所以看起来轻松,是因为身体本身就在“帮忙”;机器的动作之所以看起来流畅,是因为背后有一整套高强度的控制系统在持续对抗物理。生物的“自然感”来自结构,机器的“自然感”来自计算,这种差异不会因为舞台效果而消失。


刚性路线的天花板问题


如果把视角再拉远一点,就会出现一个无法回避的问题:仅靠刚性机构加上越来越复杂的控制算法,是否真的能够无限逼近生物的非刚体柔性?还是说,终有一天,技术路线会不得不转向可变刚度结构、更强的机械顺应性,甚至类肌肉驱动与“结构本身即智能”的设计思路?


从这个意义上看,这次表演既是一场漂亮的工程成就,也是一种对刚性机器人路线物理边界的无声提示。它证明了这条路可以走得很远,但同时也提醒我们,机器之所以要“算”得如此辛苦,恰恰是因为它在结构上,并不是一个生物。


结语:从“人非刚体”到“机器人如何模仿非刚体”


当年用“人非刚体”解释汪嘉伟“滞空”,是在提醒不要用错误的物理模型去理解生物体运动规律。今天看机器人表演武术,我们或许也需要一个类似的提醒,即不要把“看起来很像人”误当成“机器正在变成生物”。更准确地说,我们正在见证的,是控制工程越来越成功地为刚性机器制造出一种“仿佛不是刚体”的运动幻觉。


这丝毫不贬低工程成就。恰恰相反,正因为这条路线与材料和结构的直觉背道而驰,它的每一步进展才显得昂贵而真实。从排球场上的“滞空”,到春晚舞台上的机器人表演,贯穿其中的始终是同一个问题,当系统不是刚体时,运动会呈现怎样的可能性?而当系统注定是刚体时,我们又需要付出多大的工程代价,才能让它看起来如此具有生物柔性?


 该图片属于AI生成图片


参考文献:

1. Alexander, R. McN. (2003). Principles of animal locomotion. Oxford University Press.

2. Ott, C., Roa, M. A., & Hirzinger, G. (2016). Hierarchical operational space control of humanoid robots. The International Journal of Robotics Research, 35(5), 547–566. https://doi.org/10.1177/0278364915596190

3. Pfeifer, R., & Bongard, J. (2006). How the body shapes the way we think: A new view of intelligence. MIT Press.

4. Raibert, M., Blankespoor, K., Nelson, G., & Playter, R. (2008). BigDog, the rough-terrain quadruped robot. In Proceedings of the 17th World Congress of the International Federation of Automatic Control (pp. 10822–10825). IFAC. https://doi.org/10.3182/20080706-5-KR-1001.01833

5. Zajac, F. E. (1993). Muscle coordination of movement: A perspective. Journal of Biomechanics, 26(Suppl. 1), 109–124. https://doi.org/10.1016/0021-9290(93)90083-Q




以下内容为段永朝和邵青的讨论:


段永朝:太精彩了!“结构即智能”这是一个重要的判断👍👍


邵青:我只是想告诉大家,与Boston Dynamics相比,我们的“不同”在哪里。


段永朝:生物的自然感来自结构,机器的自然感来自计算。这是极有见识的。


记得有一本书,英国生物学家达西 · 汤普森(D'Arcy Thompson)在1917年出版的经典著作《生长与形态》(On Growth and Form)。作者的主要思想是,生物形态的形成可由物理规律加以解释。诸如细胞黏附、相分离、重力、扩散和界面张力等普遍存在于非生命与生命系统中的通用物理过程,同样在形态发生和图式形成中扮演关键角色。


这个思想对图灵有很大影响,据说图灵在后几年里,主要关注的就是“形状”问题,他是从化学结构入手的。


邵青:生物的自然感来自结构,机器的自然感来自计算。最早是由Pfeifer和Bongard在2006年提出的,也就是我的参考文献第3。


您这是二次拔高的节奏了!把我原来工程-控制层面上升到了形态-物理-智能起源层面。我理解您的意思是应该从“生物的自然感来自结构”到“结构本身由物理法则塑形”再到“计算是在替代,而不是拥有这种结构”,对吧?那我改一版给您吧。


《生长与形态》(On Growth and Form),我参考的是1942的第二版。而图灵从化学结构入手谈“形状”则是1952年的事儿了。


段永朝:您讨论的刚体和非刚体的关系,是一个非常紧要的命题。这个命题的意义,在于打通无机物和有机物的边界和纽带;这也是肉身与灵魂、有形与无形间内在关联的第一步。


从道理上说,有机无机均从物理定律,但物理定律只能区分形态(形状),难以触达结构。


您从结构与计算的关系入手阐释,非常巧妙。


这里或许蕴含更深的道理,值得深挖。


邵青:经永朝兄一再点评,确实感觉有太多的深层逻辑值得深入探讨。比如智能的下一步很可能不是更强的控制,而是怎样让结构本身承担更多的智能职能;结构又是怎样把物理过程组织成智慧能力的;以及怎样从“像人类”过度到一种以结构承载智能的“新物种”。记得嘉明兄十几年前在台大就在讲“后人类”,或许就是“智能结构”和“智能生物”甚或是“智能结构生物”。


显然,我们讨论的问题已经超出工程技巧,进入“结构如何承载物理、又如何承载智能”的层面。达西·汤普森与图灵解决的是“形态如何从物理中涌现”,而我们今天面对的则是:“结构如何从物理中涌现为能力与智能?”今天机器人最大的限制,不是算力,而是结构仍然太“外在”,智能还主要寄居在控制器里,而不是“浸入”材料与结构之中。我想,或许真正打通无机与有机边界的,不是“更像人”的具体动作,而是让结构本身成为智能的一部分?


段永朝:为什么科幻作品对“变形金刚”如此痴迷?我觉得正是这一思想的冲动:跨越层级,即跨越结构。


最精巧的当属生物细胞的膜结构,既保持流动性,又有半透的不对称性。


您说的对,完全赞同!不是“像不像人”,而是智能中能否感知到结构的存在。








邵青,教育管理学博士生物医学与生物制药领域专家。旅美学者、企业家,苇草智酷创始合伙人博腾股份股东及战略投资顾问莫干山研究院专家咨询委员会委员、副院长美国希望基金会常任董事

段永朝,苇草智酷创始合伙人,信息社会50人论坛执行主席,中国计算机学会终身会员,中国自动化学会会员,中国自动化学会区块链专业委员会副主任委员,《智能科学与技术》学报编委,数字论坛创始成员。

苇草智酷简介——


苇草智酷(全称:北京苇草智酷科技文化有限公司)是一家思想者社群组织。通过各种形式的沙龙、对话、培训、丛书编撰、论坛合作、专题咨询、音视频内容生产、国内外学术交流活动,以及每年一度的苇草思想者大会(原名互联网思想者大会),苇草智酷致力于广泛联系和连接科技前沿、应用实践、艺术人文等领域的学术团体和个人,促成更多有意愿、有能力、有造诣的同道成为智酷社区的成员,共同交流思想,启迪智慧,重塑认知。