对话宇树科技王兴兴:机器人AI还不太够,大语言模型只是一部分

全文2428字,阅读约需7分钟,帮我划重点

划重点

01宇树科技创始人王兴兴表示,机器人行业目前最大限制是AI还“不太够”,需要发展真正的机器人模型。

02他认为,大语言模型只是机器人模型的一部分,真正的机器人模型需要加入图像、机器人关节指令、激光雷达等数据。

03与此同时,王兴兴相对克制,表示宇树科技不会“All in”人形机器人,仍与四足机器人一起“双线并重”。

04他预测,通用机器人领域的iPhone时刻可能会在今年年底之前出现,但不会超过5年。

以上内容由腾讯混元大模型生成,仅供参考

过去一两年的全球科技浪潮中,在大语言模型技术影响下,机器人成为热门赛道之一。在2024世界机器人大会期间,宇树科技创始人王兴兴接受了新京报贝壳财经等媒体采访。他表示,机器人行业目前最大限制是AI(人工智能)还“不太够”,真正解放机器人AI能力是“让它干活”,实现这一愿景不能只依靠大语言模型,需要发展真正的机器人模型。
“当有人愿意采购产品、社会对它有认可度时,我们才去做。”宇树科技入局人形机器人是顺势而为,但不会“All in”,仍与四足机器人一起“双线并重”。面对资本热潮,王兴兴相对克制,一如他的创业经历:从他脑海里诞生小机器狗的想法到他正式扎进机器人赛道大约历时三年。相比之下,在预测通用机器人的iPhone时刻时,他又相对乐观:“不会超过5年”。
机器人行业最大限制还是AI不太够
贝壳财经近期人形机器人火热,但早期业界普遍不看好,请问你如何看待?在人形机器人发展战略上,宇树科技有明确规划,还是更多随着社会共识变化而变化?
王兴兴基本还是追寻整个社会共识。2020年前,全球人形机器人控制技术做得不是特别理想,性能上不去,没办法看到它有实用价值或者让它去干活。
2021年到2022年,全球科技非常关注人形机器人。并且在2022年底大语言模型出来后,大家已经看到AI赋能机器人的潜力。在2022年底,虽然我们还没做人形机器人,但已经有客户想买。我们觉得社会共识、热度、客户的期待程度已经足够,所以在2023年正式开始做人形机器人。
贝壳财经机器人疯狂受关注,这背后存在AI带来机器人进步的判断,这其实忽视了机器人本身的技术进步。目前宇树科技在机械和动力等方面有哪些重要突破?
王兴兴目前这波机器人浪潮主要是AI带来的。但真正解放AI的能力,还需要让机器人去干活。我认为现阶段机器人行业一个最大的限制还是AI不太够:AI模型、训练数据集、场景落地部署这些都远远不够。硬件目前也不够,但它是工程问题,可以预估时间。减速器寿命、负载能力、灵巧操作精度、视觉感知分辨率、执行速度等这些硬件方面当然要继续完善,但不是最大限制。
发展真正的机器人模型只是大语言模型还不够
贝壳财经从目前人形机器人研发的角度看,大模型可以重点解决哪些技术问题,主要应用在哪些方向?大模型和人工智能的应用有望降低研发成本吗?
王兴兴大语言模型或多模态模型可以运用在机器人领域,但真正的机器人模型要发展,只是大语言模型还不够。机器人模型本质上跟大语言模型有很大区别,大语言模型是机器人模型的一部分,例如与机器人沟通需要语言。对机器人或具身智能来说,最主要的还是让它干活,而不是在家里听你的唠叨或和你对话。
让机器人干活还是要做出机器人模型,例如加入图像、机器人关节指令、激光雷达等数据。像特斯拉直接招人采集数据,然后训练。这部分训练和大语言模型关系不大,更多是模仿学习。这个模型结构和大语言模型也偏差较大,这是目前的方向,但整个体系不像大语言模型那么成熟。
在机器人具身智能领域,大家的想法、技术路线,包括共性都不太一样。这有点类似ChatGPT出来的前一两年:大家已经发现要往某个方向做,但没有哪家敢打保票说我的方向绝对正确。
电动Atlas宇树科技G1撞车”:产品或技术浪潮发展相对成熟时,趋同不可避免
贝壳财经宇树科技和电动Atlas都采用的三指,可以详细介绍为什么三指刚刚够用,而不是两指或者四指?
王兴兴目前具身智能或人形机器人的技术方案不是特别统一,典型代表就是手指。为什么用三指?因为大部分产品只用三只手指也能抓住一个很小的东西。从实用性出发当然希望硬件越来越简单,甚至只有一个爪子,爪子里只有一个电机,就尽量把活干了。
目前,一个电机确实能干活,例如把物体抓到某个位置。但如果要做更小的事,例如拿一个电烙铁做焊接或拿一双筷子,只用两只手指或只有一两个关节的手指很难实现,但三只手指基本能完成。随着AI技术的成熟,大家对硬件的自由度、数量、外观、灵活度及要求也越低。
贝壳财经:人形机器人电动Atlas上线,在不久之后的5月,宇树科技公布G1。这两款前后出现的人形机器人,在灵活度和外形上都有一定的相似性,为什么会出现这种巧合?G1会率先在哪些场景实现应用?
王兴兴一个产品或一项技术浪潮发展相对成熟时,趋同不可避免。G1不仅运用于工业,可能更多还是一个通用硬件平台的概念。它比较小,工业使用相对大的机器人,它们的负载能力、操作空间更大。我们欢迎在G1基础上做算法的开发落地应用,包括商业端或家用场景。
贝壳财经关于成本问题,其实市场对G1价格反应还蛮大,为什么通过自研能够做到这么大幅度的降本?能不能具体讲一讲您对降本这个事情的看法?
王兴兴目前人形机器人体量还没有完全起来,如果定价太低,可能对所有人、对我们、对整个行业都不是好事。如果后续整个体量有所提升,例如到明后年,机器人的能力也会越来越强,价格可以有更好的调整。
另外,降本就是要把所有的零部件各方面设计得比较极致,哪怕是一颗螺丝钉,还要在生产上做到相应的极致管理。另外,“有量就降成本”这件事毋庸置疑,但它也是公认的。某种程度上,公认的事情不是最有竞争力的,很多人也知道在设计阶段就要降成本。汽车也一样,如果找比亚迪拆车拆机视频来比对,大概就知道它为什么成本做得相对低,这值得学习。
不会All in人形机器人离通用机器人iPhone时刻不超过5年
贝壳财经今年很多人形机器人宣布进厂打工,你怎么看这个现象?
王兴兴这是一个趋势,目前基本还处于试点阶段,没有到真正商业闭环的阶段,例如达到一台机器人可能比人还能降低成本的阶段。
贝壳财经人形机器人的快速发展,对四足机器人来说是机遇还是挑战?今年宇树科技在四足机器人上有哪些研发计划?
王兴兴四足机器人以及它的硬件、电控系统、软件、OTA升级平台、后台、AI算法等与人形机器人共用的地方非常多,能共用的地方尽量共用。
今年我们在人形机器人上投入会更多,我们目前没办法每年都有全新的四足机器人产品,但都有一些硬件、软件升级。可能明年也会有新的四足机器人产品,并不All in人形机器人,基本还是两条路线并重。
贝壳财经通用机器人领域什么时候会出现一个iPhone时刻?
王兴兴我比较乐观,在今年年底之前,全球至少有一家公司或实验室能做出通用型的机器人AI模型。对于iPhone时刻,还是希望在工业或服务业能真正出现终端产品,并且这个行业出货量暴增。iPhone时刻可能还要3年或4年,但不会超过5年。
新京报贝壳财经记者 韦英姿
编辑 王进雨 
校对 卢茜