1.星海图联合创始人许华哲认为具身智能赛道虽有泡沫,但相比元宇宙泡沫化要好,因为具身智能拥有扎实的硬件基础。
2.许华哲表示,融资能力强且能够产出实际成果的公司更能穿越周期,迎来下一轮市场的热情高涨。
3.除此之外,星海图计划在北京和苏州两地布局,苏州负责机器人本体的研发生产基地,北京则专注于具身AI研究。
4.目前,星海图已融资近1亿美元,蚂蚁集团先后两次领投,公司将继续加大研发投入。
5.许华哲预测,人形机器人赛道上的“淘汰赛”可能会在2到3年后开启。
以上内容由腾讯混元大模型生成,仅供参考
当人形机器人的热度在春节后迈上另一个台阶,认为赛道出现泡沫化、同质化的质疑声也浮出水面。
“大家非常担心,一哄而上以后,会不会像中国很多的产业一样,又是一地鸡毛。我觉得这点根本不用担心,一定是一地鸡毛。”博鳌亚洲论坛2025年年会一场分论坛上,民建中央经济委员会副主任马光远直言,产业发展不可能没有代价、不走弯路,但只要机器人的火热本身符合产业规律,“这个火应该烧一下”。
“具身智能泡沫化总比元宇宙泡沫化好。”3月27日,星海图联合创始人许华哲接受南都记者采访时说,具身智能有着扎实、有用的硬件基础,出现一些泡沫并无大碍,不会像一些风口那样,泡沫破裂后无法沉淀下任何实质性的成果。他认为,融资能力强且能够产出实际成果的公司,更能穿越周期,并迎来下一轮市场的热情高涨。
星海图是一家2023年9月成立的具身智能企业,四位联合创始人中,除了许华哲只在清华大学交叉信息研究院任教以外,高继扬、赵行、李天威三位均有在自动驾驶公司从业的经历。
2月下旬,星海图宣布完成3亿元人民币的A轮融资。这是星海图一年时间内的第四笔融资,累计融资近1亿美元,蚂蚁集团先后两次领投。
星海图是许华哲创业的第一站。采访中,许华哲既谈到了星海图自身的业务布局、技术路线,还从行业角度分享了他对跨界玩家入局具身智能、初创公司拼量产、融资热度等话题的看法。
以下是对话内容(为方便阅读,做了不改变原意的编辑):
“跨界玩家有很强的动机”
记者:入局人形的玩家类型越来越多,除了车企蔚然成风,还有传统的工业机器人公司、家电企业乃至vivo这样的手机厂商。您如何看这些企业跨界下场做人形机器人?初创公司会感受到压力吗?
许华哲:以车企来说,现在电动汽车赛道已经很拥挤了,我觉得“巨头”都在寻找自己的增长点。制造业下一个能升级的点是什么呢?大家自然会想到机器人,尤其是如今火热的具身智能机器人。从用途来说,具身机器人既能在车厂里打工,又能和家电做设备串联,还可以跟手机去结合,扮演移动的大脑和身体。所以跨界玩家拥有很强的动机。
对创业公司来说肯定是有好有坏了。好处是我们有了更多玩伴,可以共同完成一些事情。比如,我们不可能自己制造MR(混合现实)设备,但像vivo,将MR作为机器人技术布局的一环,意味着我们未来可能不用去花3万块钱买苹果的Vision Pro,而是跟具身智能赛道上的伙伴一起去做。
跨界玩家增多,说明具身智能赛道在变好。大家都比较相信这条赛道有未来、有前景,能做出东西。越多人涌入,赛道相应地发展越快,整体来说利好行业。
当然,挑战也很多。创业小公司如何部署战略,其实是挺难的话题。因为初创公司的资源肯定不如人家多,“巨头”随手就能拿出我们融到的钱。
如何应对?首先是要坚定。当看准一件事,立刻行动和迭代,去占领用户心智,或者抢占应用场景。做事坚决,是初创公司的一个优势。大厂很多时候比较犹豫,害怕错过机遇,但又不希望在没看清之前就立刻跳进去,这给了我们生存的宝贵时间。虽然一些大厂在公开场合说要重磅投入,但私底下并不像我们一直做机器人或者做具身智能的人,有一种信仰在。信仰的力量听起来很虚,但其实很重要。比如,OpenAI的GhatGPT能成,也是有一群人坚信遵循scaling law(规模定律)可以把大模型做出来。因为相信,所以坚持。
初创公司另外需要做的,就是在技术还没有成熟之前,一直保持先进性。这是因为,当前阶段,钱重要的同时,市场上还很难找到能把具身智能这件事做成的人,全国最多可能只有20个人能把VLA(视觉-语言-动作模型)训出来,这给了创业公司尽可能拉长技术领先时间的可能性。一旦后面技术成熟,只要花钱就能找到能做具身智能的人,此时,钱就变得更为重要。很显然,大手笔花钱不是创业公司的强项。
创业公司能做的第三件事是尽快量产。就像造新能源车那样,当量产的拐点到来之后,就很难再融入到游戏之中了。所以,初创公司要尽快地跟其他玩家一起达到拐点,或者率先达到拐点。
记者:作为蚂蚁集团的被投公司,你们怎么看蚂蚁前段时间下场自研人形机器人?
许华哲:蚂蚁本身是一家科技公司,本来就该做这种新技术,没有太多可惊讶的。星海图也在和蚂蚁灵波科技公司合作,瞄准“无人后厨”的场景。在算法上,双方有一些分工;本体层面,则以星海图的机器人作为载体。
记者:你前面提到vivo机器人技术栈布局中的MR,星海图后续也会就此和vivo合作吗?
许华哲:昨天(3月26日)跟胡总(vivo执行副总裁胡柏山)交流了解到,vivo后续会在机器人业务上大力投入,而且他们更着重机器人的“眼睛”和“大脑”部分。vivo虽然没有排除自己做硬件,但短期内可能还没有下决心去造机器人硬件,先看看产业链上有没有合作伙伴可以一起把机器人业务做起来。vivo这次邀请我来参加博鳌论坛的一场分论坛,也是希望讨论未来合作的机会。
3月27日,清华大学交叉信息研究院助理教授、星海图联合创始人许华哲参加vivo主办的博鳌亚洲论坛2025年年会“促进经济复苏:科技企业的机会与挑战”分论坛。图:杨柳
量产拐点未至,低价营销先行
记者:你前面还提到量产的拐点,多大规模才算是拐点?
许华哲:很难给出一个具体的数字,也许是一家公司年产10万台,但这也许都是不负责任的猜测。
记者:今年又被称为人形机器人的“量产元年”,不少公司最近也宣布了下线交付进展。这个速度是否有超出您此前的预期?
许华哲:不会。当你真正投入到硬件开发中,会发现它并不像想象中的那么困难。这更多地是需要清晰地梳理每一个链条,确保每个部分都研发完善,然后将它们拼接整合在一起的过程。所以,量产这件事儿的到来,技术上本身就是可以实现的。其次,外界对人形机器人的热情也起到一定催化作用,实现更多的量产。
记者:量产交付过程中,一些企业掀起低价报价潮,比如最近松延动力给出3.99万的起售价。这是一种降本的良性竞争,还是落地“价格战”的“内卷”范畴?
许华哲:倒不觉得是卷价格的恶性竞争,只是一种营销手段,在公司早期打响自己的品牌。宇树G1机器人的9.9万元只是起售价,真正卖给实验室,还得三十多万。如果真的只以9.9万元的价格就把所有东西卖给别人,那这就是“价格战”了。而且,无论是宇树G1,还是松延动力3.99万元的人形机器人N2,身材都比较矮小(G1身高1.3米、N2身高1.2米),价格自然可以报得较低。
记者:虽然量产拐点没到,但做人形机器人本体的公司已相当之多了。你认为现在还是入局做本体的好时机吗?
许华哲:如果只是做硬件,当下入局也并非完全不可行。硬件不像软件那么高科技,依靠供应链,就能做出硬件。但能否加入做“整机+具身智能”,可能需要打个问号。现在入局也不算晚,但肯定不是最好的那个时间档口了。
记者:初创公司的路线也有分化,有的专注于硬件,有的只做具身智能模型。但前段时间,包括Figure AI和智元称,机器人公司要垂直整合硬件、AI和制造。你是否认同这一观点?
许华哲:“整机+智能”目前来看确实是比较优的模式。原因是,类似于互联网,入口对具身智能产业也很重要。入口在谁的手里谁就比较舒服。有了机器人整机,才有数据入口。谁拿到数据,谁就能造出更好的模型,更好的模型又给用户带来更好的体验。纯粹做具身智能模型的公司只能从别人手中购买入口。
如果你的软件真的特别好,是世界独一档的,那很有可能会出现所有硬件供应商都求着跟你合作。比如美国具身智能公司Physical Intelligence就想走这条路,用AI去赋能所有的硬件公司。
但我觉得在中国不是特别适合做这件事儿。中国有硬件制造优势,机器人厂商为什么不直接把这部分也做了呢?另外,供应链上的玩家可能没有想象中那么愿意把硬件分享给你,倾向于自己做具身模型。基于这样的判断,星海图同时做AI和整机。
记者:星海图硬件自研的比例有多少?
许华哲:百分之八九十。可能唯一不自研的是芯片,芯片还是外采自英伟达或者是国产芯片。公司早期在电机零部件方面依赖一些供应商,但现在也开始进行一定比例的自研。
广积粮+省钱,“随时准备过冬”
记者:星海图创业时,你和高继扬、赵行、李天威三位联创是如何凑成一个团队的?
许华哲:继扬是我在清华电子系的师兄,比我高一级。和继扬在本科的时候有过几面之缘,不算很熟悉。赵行是我在清华交叉信息研究院的同事。后面一起聊下场创业,也是通过赵行和其他几位联创结识。聊完以后一拍即合,觉得风来了。
记者:不少像星海图这样的具身智能初创公司的创始团队,都有学院派背景。但外界对学院派背景的创企有一种担心认为,可能会过于坚持自己的路线,而不愿适应行业技术路线的风向转变。这种说法是否成立?
许华哲:有一些道理,但星海图显然不是这样的风格。学术圈有一种风气,就是说做一个研究,要一直做下去,哪怕从热门变成了冷门,也要接着做。也许再熬过一个周期,又重新变成热门。但在创业上,可能逻辑不完全是这样。商业上是关乎生死存亡的,而且创业者的责任比单纯的研究者大得多,毕竟公司还有那么多员工。
我们首先坚定地相信我们是正确的,但如果有充分的理由论证我们犯错了,会立刻调转船头,去做最正确的事情。这种灵活性也是创业公司的优势。
记者:星海图现在有多少员工?
许华哲:80人左右。
记者:你们规模相对较小,之前了解到智元至少500多人的规模了。
许华哲:这跟每个企业的风格有关。除了我以外,星海图的其他三位联创都有过自动驾驶行业穿越周期的经验。他们看到当风口遇冷,很多明星公司立刻就倒下。所以,我们在“广积粮”的同时,不会大手大脚地花钱,不会立刻把摊子铺得很大。这是一种底线思维,是为了穿越周期,随时准备过冬。
另外,我们觉得好的创新一般都不是大团队做出来的,DeepSeek便是很好的证明。大团队的优势在工程化。随着人员规模的增加,沟通成本也在增加,会阻碍创新的锐度。所以我们有意地控制规模,只招精锐的人,不要盲目地去扩充一些中庸的人,这反而会拖慢节奏。但未来如果量产,肯定是要扩充人员规模的。
记者:智元这类刚成立两年的公司,迅速将规模铺得这么大,你从业内人士角度如何看这种打法?
许华哲:就我了解,智元采取的是生态打法。智元迅速成为一个大公司,同时孵化其他创业公司,建立起自己的产业生态。智元就像是一艘航母,其他孵化出的公司是航母战斗群的一部分。说实话,这种做法不像是一家传统创业公司。我们不会一开始就向下游布局。
记者:这种打法会更有利于公司融资或扩大估值吗?
许华哲:融资市场上,有的投资机构喜欢技术强的,有的喜欢资源强的,还有一些喜欢投规模大的。规模大的看起来最稳,对融资肯定有一些帮助。但就我们而言,融资只是把事做成的条件,而不是我们要做成的那件事。
“投资人都被我们充分‘教育’过了”
记者:很多初创公司都在发布VLA模型的演示视频。业内人士能看出哪些门道?
许华哲:VLA是这轮具身智能技术突破的一个看点,为了融资和曝光度,许多公司都宣称自己是做的VLA。如果在这个领域待一阵子,你就学会看这些视频是面向哪些受众的。一些厂商的视频面向大众,因为经过了充分的剪辑,像拍大片一样,视觉效果上很有科技感。但业内真正想看的,是一镜到底地演示机器人如何完成一项任务。
真正的VLA,必须具备长序列的动作执行能力、语言指令的跟随能力等,灵巧型和泛化性比较高。
记者:这种剪辑后的演示视频能迷惑到投资人吗?
许华哲:投资人是一个巨大的群体,里面有很聪明的,也有很有钱的。很聪明的那一类中,有的是会认真去读技术论文,跟一线的技术从业者做访谈,梳理各种技术细节。这样的人你是骗不过的,他们知道什么东西该看,什么东西是假的。有些投资人对技术本身没那么关注,但对具身智能赛道非常有热情,获取信息主要靠打听,常常掌握的是二手乃至三手的消息。
记者:春节后宇树、众擎等初创公司频繁发布机器人炫技视频,你们的投资人会因此施加压力吗?
许华哲:其实不会。因为我们的投资人都被我们充分“教育”过了,他们知道这是两套技术。机器人的手部操作(manipulation)能力,主要靠模仿学习、VLA去完成,可能还会再借助强化学习等手段。但机器人腿部的移动(locomotion)能力,采用强化学习加仿真的路线即可完成。
走路、跳舞、跑步这些事儿,对机器人的精度要求低,只要能保持平衡就行。而且,这些腿部动作能力相对而言易于在仿真环境下模拟。如果让机器人去抓取一瓶水,一旦产生几毫米的误差,机器人的手就无法完成抓取。这个过程是非常困难的。所以你会看到,即便是Figure AI的机器人,在将物品放入冰箱都哆哆嗦嗦。其根本原因在于,操作本身是难于locomotion的。
当投资人知道这些技术原因以后,他们会有一个合理预期。
记者:既然技术侧重点不同,那宇树这类路线下的机器人能适配当下哪些应用场景?
许华哲:现在不排除人形机器人的最大价值就是提供情绪价值,比如给4S店做导购、在商场跳舞等等。这些其实是短期热情带来的,长期可能未必就一直喜欢机器人去干这个事儿。再往后,做manipulation一定是各家的必选项,否则意味着机器人不具有劳动能力。
苏州、北京两地如何布局?
记者:研发VLA需要数据,数据又是当前一大瓶颈。星海图的数据来源有哪些?有没有自建数据采集工厂的计划?
许华哲:我们使用市面上的开源数据,以及自采的数据。目前在星海图北京办公点有几位采集员,也在苏州建了一座数采工厂,场地和机器人已经准备就绪,采集人员也正在逐步到位。
记者:北京和苏州两地数据采集的效率如何?
许华哲:目前已经累计了1000小时的可用数据,今年内可能达到几万小时的数据量。预计今年在苏州数采工厂配置50位采集员,以及对应的50台机器人。
记者:仿真数据在星海图机器人的训练中扮演怎样的角色?
许华哲:仿真数据可以起到增广的效果(data augmentation,在现有数据基础上去做增强、扩充、调整)。仿真数据少用有效、多用有毒。由于仿真平台与现实环境之间存在差异,如果模型主要基于仿真数据进行学习,可能会导致机器人在实际应用中表现不佳。在光影、视觉层面可以大量用仿真数据,但物理层面一定要以现实真机采集的数据为主。
记者:那你怎么看银河通用机器人公司以仿真合成数据为主的路线?
许华哲:银河通用一直在做pick和place(抓、放)层面的事情。合成数据在训练抓放能力上一定程度上具备可行性,但丢失了更大的视角——我希望机器人做的远远不止pick和place。用“搓盘子”这一操作为例,当盘子摆放成一摞,如果机器人要把最上面的盘子拿起来,仅仅通过pick是做不到的,因为盘子底下被挡住,机器人的手搓不进去。盘子底下复杂的摩擦力,很难在仿真环境下模拟。所以,我认为银河通用的路线侧重于短期应用。
记者:采集到的数据,当前用于哪些具体场景能力的训练?
许华哲:宏观来讲就是操作能力。微观层面,则是用于客户的几个场景。比如在车厂搬运箱子,在和海尔合作的厨房场景做展示营销。
记者:很多公司都说让人形机器人到车厂搬运箱子,你们会感受到同行的竞争吗?
许华哲:目前不会,机器人能力没有那么强,大家都还停留于做POC(概念验证)的阶段,不存在开始挤占市场份额的情况。只有当机器人能够真正投入使用,才会出现争夺客户的局面。
记者:星海图在北京和苏州两地的业务分配是怎样的?
许华哲:苏州是机器人本体的研发生产基地,今年还会在苏州建造一个生产线工厂。希望工厂具备万台产能的水准,但不是说实际生产万台。北京的注册地在亦庄,这是因为首钢基金投了我们,相当于被引进到亦庄。但北京的办公室目前仍在海淀,一方面我和赵行在清华教书,同时也便于吸引海淀高校的实习生。实习生的产出,甚至不低于在业界有两三年工作经验的员工的产出。后续,海淀的办公室继续保留,专注于具身AI的研究。也会在亦庄建造一个更大规模的办公室,用于研发双足人形机器人等硬件。
两到三年或迎来“淘汰赛”
记者:今年年初,人形机器人的热度愈发高涨之后,你们在融资上感受到的水温和去年相比有何变化?
许华哲:体感上,融资变容易了很多。去年,投资人的心态可能是有兴趣投资,但需要进一步考虑。然而,今年他们的心态已经变成FOMO(Fear of Missing Out,害怕错过),更倾向于迅速达成一致,抓紧机会投资。
记者:人形机器人整机的公司,融到多少钱是门槛?
许华哲:在股权稀释没有那么夸张的情况下,融资肯定是多多益善。当然也有前期融资太猛,后期融不动的情况。
人形机器人公司的成本主要出在人力和算力两个方面。机器人的制造成本可以从订单出售中得到回血,唯一在白白烧钱、短期内没有收益的就是人力成本,以及训练具身模型所耗费的算力、显卡。如果按照这两方面成本计算,融到1亿美元会是一个小的门槛。
记者:热度高涨的同时,近期也有不少文章发出警惕泡沫的声音。你认为,人形机器人赛道现在有泡沫化现象吗?如何正确看待?
许华哲:具身智能泡沫化总比元宇宙泡沫化好吧!因为具身智能有着扎实、有用的硬件基础,有一些泡沫并无大碍。包括互联网早期也有很大的泡沫,当泡沫破碎,沉淀下来的公司都活下来了,谷歌就是其一。而不会像一些风口那样,泡沫破裂后什么实质性的成果都没有留下。加之当下很难找到其他能媲美具身智能的新兴赛道,于是大家纷纷涌入进来,这势必会造成泡沫。
记者:泡沫什么时间会第一次破碎?有投资人近期交流时就认为,“淘汰赛”大概1-2年后就会开启。
许华哲:有些公司表面上对人形机器人表现出了极大的兴趣并投身其中,但实际上造出来的机器人并不好用,或者声称专注于具身智能技术,却无法实现任何真正的智能化功能。如果这类公司在融资方面也没有显著的表现,那么它们很可能面临被市场淘汰的命运,要么被其他公司吸收合并,要么破产消失。而沉淀下来的优秀人才会逐渐向头部公司集聚,因为公司不好不代表人不好。那些融资较多且能够实际产出成果的公司,或许更能穿越周期,并迎来下一轮市场的热情高涨。
如果让我预测,觉得应该是2到3年迎来“淘汰赛”。我认为今年会持续看到许多既有趣又能提振信心的成果出现,但这样的发展速度不会一直持续。后续遇到瓶颈停滞不前时,就需要大家共同攻克。
采写:南都记者 杨柳 严兆鑫 发自海南博鳌