来自卡内基梅隆大学、马里兰大学、哥伦比亚大学、斯坦福大学、麻省理工学院、清华、北大、港大等全球 AI 顶尖高校和 Nvdia 等研究机构的华人团队,历时 24 个月,合作开发了一款能够生成 4D 动态世界的生成物理引擎 Genesis。
(来源:GitHub)
一经发布,项目迅速在 X 获得数十万人关注。
Genesis 作为一个从底层重新设计和构建的通用物理引擎,其核心特点是将多种物理求解器及其耦合集成到了统一的框架中。
课题组领导者淦创教授称:“我们的方法核心是逆向工程人类心智模型,并构建由生成物理引擎驱动的机器人大脑!”
借助 GPU 加速的并行计算技术,以及优化的碰撞检测、自动休眠和接触岛等特性,Genesis 能够实现前所未有的模拟速度——在物理模拟速度方面,Genesis 比现有的 GPU 加速机器人模拟器(如 Isaac Gym/Sim/Lab、Mujoco MJX 等)快 10 到 80 倍,同时还保持了高精度的物理模拟保真度。
在单平面与 Franka 机械臂的操作场景中,其运行速度达到了 4300 万帧每秒,相当于实时运行速度的 43 万倍。对于大规模模拟场景,Genesis 还能够通过自动休眠机制加速已收敛和静态实体的模拟过程,进一步提升整体性能。
(来源:GitHub)
在功能特性方面,Genesis 建立了一个统一的框架,支持多种最先进的物理求解器,能够模拟广泛的材料类型和物理现象。平台不仅提供了照片级真实的光线追踪渲染功能,还支持完全可微分的模拟能力。
目前,其 MPM 求解器和工具求解器已经实现了可微分性,其他求解器的可微分功能也将陆续加入。并且,Genesis 还包含了物理精确且可微分的触觉传感器模拟。
Genesis 的另一个重要创新是将物理引擎与生成式 AI 技术相结合。平台集成了基于大语言模型的生成代理,能够根据自然语言描述自动创建各种形式的数据。例如,当用户要求生成“一个手持棍子的孙悟空小型角色在桌面上奔跑 3 秒,然后跳跃到空中”这样的场景时,Genesis 能够自动生成符合物理规律且视觉连贯的动画序列,同时智能控制相机运动,确保最佳观察视角。
在机器人控制方面,Genesis 展现出了全方位的能力。系统能够自动生成各种复杂的机器人控制策略,从四足机器人的各种步态、双足跳跃和倒立,到人形机器人的单脚跳跃,再到机械手的精细操作。例如,Genesis 能够为 24 架无人机编队生成同步起飞和翻转动作的控制策略。且在模拟环境中生成的控制策略能够成功迁移到现实世界中的机器人上。平台还支持软体机器人的模拟,能够处理蠕虫状软体机器人的运动、混合刚-软体结构的行走等复杂行为。
除了基础的物理模拟和机器人控制,Genesis 的能力还延伸到了更广泛的领域。在场景生成方面,平台能够创建包含客厅、餐厅、卫生间等完整功能空间的交互式 3D 环境。
在表情和语音生成方面,系统可以生成与文本内容匹配的面部动画和语音,并实现从中性到愤怒再到快乐等情绪的自然过渡。这种多模态生成能力为虚拟人物的创建提供了新的可能性。
目前,研究团队已经开源了底层物理引擎和模拟平台的代码(项目地址:https://genesis-embodied-ai.github.io/),生成框架部分也将在未来逐步开放。
作为一个纯 Python 开发的平台,其安装过程十分简单,还为用户提供了极其简洁友好的 API 设计。
并且,Genesis 实现了跨平台兼容,能够原生支持 Nvidia、AMD、Apple 和 Intel 的 GPU/CPU,以及 Windows、MacOS 和 Linux 等主流操作系统,这种广泛的平台支持极大地提升了其实用性。
易用、强大,或许,Genesis 真的能“开创”一个新时代,AI 离真实的物理世界,或许越来越近了。
“我认识到许多机器人学家对此方法持怀疑态度,指出设置模拟器和解决模拟与现实差距的困难。他们主张仅专注于从现实世界数据中学习。我理解这些担忧,但我坚信我们不能仅仅因为创建一个好的物理模拟器具有挑战性就绕过物理模拟器!”淦创说,“请加入创世纪社区!我们希望说服机器人界‘Generative Physics Simulator is all You Need!’”
参考资料:
1.https://genesis-embodied-ai.github.io/
2.https://genesis-world.readthedocs.io/en/latest/
3.https://x.com/gan_chuang/status/1869526910771831096
4.https://x.com/zhou_xian_/status/1869511650782658846
排版:刘雅坤