作者 | 王秋凤
很多事情,不同视角看过去,可能大相径庭。在人形机器人领域表现的尤为明显。从潜在的消费市场看,人形机器人起码火了有两三年。国内从事该业务的公司(包括供应链企业),达到惊人的6.7万家。其中也包括了20多家车企。
而从资本角度看,则产生了分歧。一批(并非全部)风投资本(VC/PE)觉得投的人太多,商业前景不明确,想抽身退步。这是正常的,风投要的回报期远比大多数项目短。期限错频决定了,风投退出方式就是击鼓传花。只要意识到“传”不下去,就会遏制投资。而产融资本,特别是和国企、地方国资有关的,即便知晓投的项目风险很高(越是火热的投资赛道,“阵亡率”越高,比如造车新势力),但更看重产业链集聚效应。哪怕项目没成,只要能落地研发中心,带动就业,就是成功。这已经有点政府思维了。
在人形机器人领域,在2025年一季度这段时间里,产业思维和财务思维正激烈碰撞。有的出有的入,热闹非凡。正如股市一样,价值分歧和市场认知差异,才是交易形成的动因。
通体人形和局部仿生
对于现在广泛谈论的机器人,有的人称“具身智能”,有的人说“人形机器人”,也有的人说“智能机器人”。无论哪一种,都和本世纪初日本人做的那些机器人有天壤之别。后者也能翻跟头跳舞什么的,但是为了一段舞蹈,需要编程调试好几个月。如果让它现场换个舞姿,对不起,程序还没来得及编。这和现在的机器人,不是一个物种。
“具身智能”强调的是与现实物理环境的交互,可以简单理解为认知-行为智能。显然,不是非得要一个人形。人形机器人和具身智能,前者大致上可以视为后者的子集。
要不要做成人形,多数情况下,取决于场景。比如喷漆机器人,组装机器人,酒店楼层服务机器人,甚至炒菜机器人,都是在特定场景下工作的。没必要做成人形。
如果任务要求跨越多个场景,比如家政机器人、通用机器人,考虑到当前社会大量设施和工具,都是针对人的形态设计的,那么就有必要设计成人形。起码涉及到运动的部分,要追求仿生设计。
还有一种情况,就是与人的情绪价值、心理学有关的需求。现在这些需求因为智能化、材料学等技术进展还没到位,无法清晰描述,做成人形也非常有必要。
迄今为止,还没有哪家机器人公司、车企,实现人形机器人的大规模量产。小规模试产是有的,比如特斯拉Optimus、广汽GoMate、宇树机器人等。
就已经曝光的外形来看,行走机构有轮足、折叠腿,没有通体仿生的,外形大致像人就行。无一例外,这些产品对头部的处理都比较简单,因为人的表情(尤其是眼睛周围的肌肉)涉及了太多肌肉运动。技术上还达不到,而且也没必要。
汽车与人形机器人技术,重合与分歧
何小鹏今年3月说,一个全新的AI时代正在到来,Al会推动汽车产业正在和机器人融合。他表示,小鹏汽车已经投入人形机器人5年,还要再做20年,花500亿投资,做成第二大业务。
他的说法,在业内有一定共识,只要看车企五花八门的机器人项目就可见一斑。一个很重要的原因在于,两者的业务要素重合度很高。
两者的BOM重合度,不仅在于电池、电机、控制芯片,还在于更基础的轻质合金、树脂、碳纤维等。从技术角度,车企和智驾供应商投资的AI方向,包括VLM(视觉和自然语言)大模型和LLM(大语言模型),OEM也开发了多传感器融合方案,积累了大量数据和算法。这些都可以同时用于两者。
虽然智驾是关于空间的智能,但对空间精度要求反而不及具身智能,对时间精度的要求又往往高过后者。
不过,人形机器人和智驾在智能技术上存在方向上不完全一致。最大的分歧在于训练数据。这背后是不同成本、训练方式以及目标的差异。
业内对机器人的数据驱动,主要有两条主要路径。一种是特斯拉为代表的真实数据驱动派,主张依赖真实环境中的物理交互数据,通过传感器收集运动、触觉、视觉等多模态信息。另一种则是国内车企(比如小鹏)、创业公司主张的数据泛化派。后者主张用合成数据加上迁移学习(跨任务知识复用),减少对真实数据的依赖,引导机器人智能的发展。
现在看,后者这么做在现阶段具备明显的现实意义。机器人现在集中于B端需求,部署量太少了。和车动辄几十万辆的部署,至少差了两三个数量级。这导致现阶段机器人能够获取到的真实数据(与环境互动)少得可怜,场景多样性也同样苍白。
而数据匮乏反过来又造成了模型训练速度不行。数据驱动有问题,当前制约机器人模型训练进展。
市场出路在于技术理想主义
虽然有一些人幻想机器人主要用于家政,填补家庭养老的越来越大的空档。但是迄今为止,中国的企业,除了一些暂时想不清楚的,大多数都谋求跨入生产力时代。
原因很简单,和单纯的消费服务比起来,生产可以更快速回笼成本,从而扩张需求。只要需求被拉起来了,模型训练、出货量,机器人业务前景都转为正向激励循环。家政场景,也有望顺势解决。
现在用规模化生产合成数据的时机已经成熟(通过我们提到的“世界模型”),以视觉和超声波雷达引领肢体控制,实现机器人自主泛化操作的能力。这个过程中,机器人有望通过多模态理解现实世界(和婴儿认知成长很像),而不是通过人类的低效引导(语言)和规则(视觉辨识)控制。
现在的机器人领域挺诡异的:商业模式不够清晰,但供应链已经比较完整了,这和汽车供应链复用程度高有关。OEM大多赔钱干,靠投资人输血过日子,怪不得一些风投要跑路。这和2019年的新能源车的情况非常像。
原因是技术不满足潜在市场期待,现在大多数公司都是采购,组装,利用开源软件攒系统,这么做根本没有壁垒可言。尽管产品量还很小,大家已经提前跌入价格竞争的泥潭。新能源汽车可是量能充分拉起来之后才打价格战的。这么看,机器人行业有点“未老先衰”。
排除工业机器人,人形机器人现在除了展示、做一些简单重复的服务,再不然就是从事一些搬运、组装、检测和其他不适合人类的环境中(比如有放射性)劳动,这些用途,多数旨在降低人类劳动负荷,有人力成本在上面卡着(机器人成本过高就会发生人工替代反杀),多少有点小打小闹。
能够破局的,就是技术理想主义,而不是现在就忙着扩展商业化路径。
我们能够预见的,是模型训练的突破,让人形机器人能够适应泛场景下的泛任务(即不事先限定场景和任务种类)。这将导致高风险场景、高精度岗位,以及场景灵活的家庭护理、教育、医疗等需求爆发。总之,简单劳动的替代没什么前途,因为这些劳动价值有限。
结 语
但是也要清楚,站在汽车市场的角度,无论机器人如何爆发, 5年内都不算什么大生意。2024年全球汽车市场价值在4.7万亿元人民币左右。而人形机器人市场,乐观地估计,5年内的单年市场价值也就1500亿~2000亿元。大致相当于届时汽车行业的3%左右,除非人类的出行方式和因机器人技术崛起而影响的生活方式,都发生剧变。
但不要忘了,两者在技术上重合度很高,而且汽车拥有显而易见的数据优势。这几乎注定了中期内人形机器人市场的成长上限。
- E N D -
秋凤空间
无肇因之始,无自限之垣
品茗聚友,坐而论道。