超30000+高质量交互数据 傅利叶正式开源全尺寸人形机器人数据集Fourier ActionNet并发布全球首个全流程工具链

3月17日,上海 —— 傅利叶正式开源全尺寸人形机器人数据集Fourier ActionNet,并发布全球首个全流程工具链。

图片

Fourier ActionNet数据集首批上线超3万条高质量真机训练数据,包含多种自由度灵巧手的训练数据及专门针对手部任务的模仿学习数据,面向全球开发者及科研机构开源共享,提供从数据采集、训练、部署的一站式解决方案。

高质量数据,涵盖多种精细化操作任务

当前,人形机器人数据集面临数据稀缺性、标注成本高且精度不足以及仿真与现实存在“数据鸿沟”等问题。从数据规模来看,真实场景多模态数据采集成本高导致规模受限,尤其是人形机器人场景数据存在明显不足的情况,这也是目前人形机器人难以从实验室走向规模化落地的主要问题之一。

本次傅利叶发布的Fourier ActionNet数据集囊括傅利叶GRx系列所有机型的各类任务训练,拥有超过30000条遥操轨迹,包含人形灵巧手操作任务,涵盖了对常用工具、家居用品、食物等多种物体的精确取放、倾倒等操作,以及在不同环境条件下实现泛化执行。

据悉,傅利叶团队采用OAK-D W 97相机收集视觉数据,提供宽广的视野范围。远程操作系统通过Apple Vision Pro作为主要控制设备,实现基于VR的操作,从而保证以人形机器人的第一人称视角进行数据采集。在该系统中,机器人操作员使用来自人形机器人视角的实时视觉反馈来操纵机器人,操作员的动作(包括手部动作)会直接传输给人形机器人,确保所执行的技能与真实人类执行的技能相接近。

VR远程操作数据库地址:

https://github.com/FFTAI/teleoperation

1.多模态+高质量+万级体量:数据来源包含傅利叶GRx人形机器人全机型数据,涵盖多种自由度的自研灵巧手,且包含专门针对手部任务的模仿学习数据,拥有万级数据体量,能够在现实场景中实现强大的学习和适应性。

图片

2.VLM标注+人工核验:Fourier ActionNet数据集采用视觉语言模型(Qwen2.5-VL-7B)来自动为数据添加标注。该模型从录制的视频中抽取26帧关键画面,并针对每个视频流生成相应的标注,随后对这些标注进行人工审查和验证,覆盖全部30000个数据样本。该数据集可用于模仿学习、视觉语言对齐(VLA)以及世界模型训练等多种任务。

全球首个全流程工具链,降低研发门槛

除了数据集的开源以外,傅利叶同步开放了全球首个包含采集算法、训练算法以及数据部署算法的全流程工具链,最大程度上与全球开发者共享研究成果。开源的训练框架(如DP、ACT、iDP3)和部署工具,进一步降低了人形机器人技术研发门槛。

图片

1.自带数据质量评估:为进一步验证数据集的质量,确保数据精度与准确性。傅利叶团队基于扩散策略(DP)、Transformer动作分块策略(ACT)及改进3D扩散策略(iDP3)三种主流模型对数据集性能进行系统性验证。结果表明,GRx全系列机型均表现出色,可稳定执行开柜门、抓取柠檬、倾倒豆子等高难度任务;

图片
任务:多种自由度灵巧手抓柠檬

图片
任务:6自由度灵巧手开柜门

图片

任务:6自由度灵巧手倒豆子

2.配套开发工具支持:傅利叶官方同步开源涵盖DP、ACT、iDP3等主流训练框架和模型部署算法,训练流程与数据格式遵循LeRobotDatasetV2结构,可以无缝部署在同一系统中,提供从数据管理到算法部署的全流程支持,从而最大限度地减少训练和实际执行之间的差异,显著降低研发门槛。

共建开源生态,推动技术共享

目前,傅利叶已与国内外20多家顶尖科研院校及行业领军企业开展合作,基于GRx人形机器人平台在强化学习、模仿学习、VLM大模型、感知系统等研究领域产出多项突破性成果。此次数据集开源标志着傅利叶从技术攻坚向生态共建的战略升级,未来还将持续开放更多覆盖全身运控、多任务协同的进阶数据模块。

图片

傅利叶始终致力于推动人形机器人开源生态建设,助力全球机器人技术共享与创新。傅利叶邀请所有对人形机器人研究感兴趣的开发者和科研人员加入开源浪潮,共同参与数据贡献与算法优化,迎接机器人技术赋能未来的无限可能。

获取方式:

Fourier ActionNet开源链接:https://action-net.org/

开源生态合作:gr_opensource@fftai.com