造机器人“工具箱”再添一员:NVIDIA推出Isaac GR00T Blueprint,少量人类示范也能生成大数据集

还记得在 2024 年 GTC 上NVIDIA 创始人兼 CEO 黄仁勋和 9 台机器人站在一起的场面吗?事实上,最近几年 NVIDIA 一直在大力发展机器人领域,它不仅积极支持机器人初创公司和机器人领域生态合作伙伴,也一直致力于为机器人领域的“掘金者”打造更好用的“金铲子”。

图片

(来源:GTC 官网)

当地时间 2025 年 1 月 6 日,黄仁勋在 CES 2025 上正式发布一款名为 NVIDIA Isaac GR00T Blueprint 的机器人开发工具。

NVIDIA Isaac GR00T Blueprint:少量人类示范就能生成大型数据集

NVIDIA Isaac GR00T Blueprint 能为合成运动生成数据,进而能够通过模仿学习(IL,Imitative Learning)来训练机器人。模仿学习,是机器人学习的一个子集,它能让机器人通过观察和模仿人类示范来获取新技能。在这一过程中,需要使用来自于真实世界的高质量数据集。此前,人们在收集这类数据集的时候,不仅繁琐耗时而且成本十分高昂。如今有了 NVIDIA Isaac GR00T Blueprint 的加持,哪怕只有少量的人类示范,也能生成包含海量内容的合成数据集。

图片

(来源:NVIDIA)

在使用 NVIDIA Isaac GR00T Blueprint 的时候,主要涉及到三个步骤:第一步,在 GR00T-Teleop 工作流的帮助之下,借助 Apple Vision Pro 在数字孪生环境中捕捉人类动作。这些人类动作被记录之后就能作为“金标准”,从而能在仿真环境中供机器人进行模仿学习。第二步,GR00T-Mimic 工作流能将捕捉到的人类示范扩展成更大的合成运动数据集。第三步,基于 Omniverse 和 Cosmos 平台构建的 GR00T-Gen 工作流,能够通过域随机化(Domain Randomization)技术和 3D 提升技术,以指数级的方式扩增上述数据集。这时,该数据集便可以充当机器人策略的输入,从而在开源模块化框架 NVIDIA Isaac Lab 中教会机器人进行高效、安全的移动和互动。

图片

(来源:NVIDIA)

Cosmos 平台:用世界基础模型缩小仿真与现实的差距

Cosmos 平台,是 NVIDIA 此次在 CES 上为机器人领域推出的第二款工具。该平台包含一系列开放型预训练世界基础模型。具体来说,它包含自回归模型和扩散模型,拥有多种模型尺寸、并能适用于多种输入数据格式。这些模型基于 1800 万亿个数据单元训练而来,训练数据包括 200 万小时的自动驾驶、机器人、无人机拍摄的视频以及合成数据。这让 Cosmos 平台不仅能够生成具有物理感知的视频,还能生成物理 AI 开发所需的世界状态。

此外,Cosmos 还能将图像从 3D 场景扩展到真实场景,从而缩小仿真与现实之间的差距。Omniverse,是 NVIDIA 此前推出的一个用于构建 3D 应用程序和服务的应用程序编程接口和微服务开发平台。当将与 Omniverse 与 Cosmos 平台加以结合,凭借 Omniverse 高度可控、物理精确的仿真能力,将能为 Cosmos 平台提供数据生成保障,从而帮助最大限度地减少世界模型的幻觉现象。

图片

(来源:NVIDIA)

设立人形机器人开发者计划,即日起即可申请

目前,NVIDIA Isaac GR00T、Omniverse 和 Cosmos 平台,已经开始在物理 AI 和人形机器人领域发光发热。包括波士顿动力公司和 Figure 公司在内的机器人公司均是 NVIDIA Isaac GR00T 的用户,同时这两家公司也在此前秀出了相关产品。与此同时,NVIDIA 还设立了人形机器人开发者计划。即日起,人形机器人的软件&硬件制造商以及机器人厂商,均可以申请提前加入该计划。

未来二十年,预计人形机器人市场将达到 380 亿美元。截至目前,NVIDIA 已经发布一系列机器人基础模型、数据管线和仿真框架,相信在这些“金铲子”的加持之下,人形机器人的开发进程必将得到加速。