宇树机器人强化学习代码全面开源,训练到仿真和实操手把手教学

全文1212字,阅读约需4分钟,帮我划重点

划重点

01宇树机器人宣布其强化学习代码全面开源,包括训练、仿真和实操过程,所有代码和教程均开放。

02此次更新新增了对MuJoCo模拟仿真的支持,并支持在实体机器人上运行,目前支持宇树的H1、H1-2和G1三款机器人。

03除此之外,宇树还在GitHub上发布了针对开源机器人系统R(obot)OS的模拟包,以及使用苹果Vision Pro对G1进行遥操作控制的仓库。

04同时,宇树还在HuggingFace上公开了训练数据集,包含五种操作,可用于机器人学习各种任务。

以上内容由腾讯混元大模型生成,仅供参考

克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

9.9万元起,还能够大规模量产的国产人形机器人,走上了开源路线。

就在刚刚,宇树机器人开源的强化学习代码又更新了!

更新之后不再是只能训练——不仅能够仿真运行,还能部署到实体机器,整个过程所有代码全部开放

图片

一开始,宇树开源的是英伟达Issac Gym平台上的训练代码,这次新增了对MuJoCo模拟仿真的支持。

图片

而且还能迁移到实体机器人上运行,目前支持宇树的H1、H1-2和G1三款机器人。

图片

这下从训练到模拟再到真机运行,整个RL套件的开源体系终于完整了。

看到这个消息,有网友激动地表示,训练机器人灵魂的方法终于公开了!

图片

全过程代码公开,还有详细教程

宇树给这个项目取名叫RL GYM,可能和一开始专门提供基于Issac Gym的训练代码有关。

现在RL GYM又支持了MuJoCo,可以在预训练的基础上进行仿真模拟了。

训练阶段的Issac Gym需要CUDA,也就是需要N卡,仿真阶段的MuJoCo则支持各种GPU,甚至CPU和TPU也能运行。

从环境的安装配置,到训练和模拟,以及最后的真机迁移,不仅有代码,还有非常详细的手把手教程。

图片

以最新款的G1为例,在Issac Gym里训练完之后的效果是这样的:

图片

放到MuJoCo里模拟,就有了开头看到在这段DEMO:

图片

最后迁移到G1真机,就能看到训练的效果了(并且真机迁移的部分还有中文教程)

图片

H1和H1-2也与此类似,另外通过RL GYM还可以在Issac Gym里训练机器狗Go2:

图片

还有更多开源项目

在宇树的整个开源体系当中,RL GYM只是其中一环,在宇树所有的GitHub仓库中星标数排第三。

图片

排第一的是针对开源机器人系统R(obot)OS推出的模拟包,包含了宇树系列机器人的质量、惯量、力矩等参数。

图片

星标数第二的则是使用苹果Vision Pro对G1进行遥操作控制的仓库,可以用于数据采集。

采集到的数据是JSON形式,而训练通过LeRobot实现,因此宇树还提供了将JSON格式数据转为LeRobot所需格式的教程。

其中包含遥操作控制的代码教程,以及硬件配置图、物料清单和安装说明:

图片

除了GitHub上发布的这些工具,宇树还在HuggingFace上公开了训练数据集,与数据采集工具同期发布。

数据集包含五种操作,使用配备有三指灵巧手的宇树G1人形机器人收集,每张图分辨率为640x480,每个手臂和灵巧手的状态和动作维度为7。

图片

比如,利用这套数据集可以让机器人学习拧瓶盖倒水:

图片

将三色积木叠放到一起:

此外还包括将摄像头放入相应包装盒、收集物品并存储、双臂抓取红色木块并将其放入一个黑色长方形容器中这些操作。

图片

最后,宇树开源的也不只是和机器人相关的项目。

上个月宇树发布了售价419美元的激光雷达, 在产品上线的同时就将其采用的Point-LIO算法进行了开源。

图片

项目仓库:
https://github.com/unitreerobotics/unitree_rl_gym

参考链接:
https://x.com/unitreerobotics/status/1868664455024029773

https://x.com/UnitreeRobotics/status/1856986819038253396