驱动具身智能的数据基石——光轮智能联合创始人兼总裁杨海波

在全球具身智能的浪潮中,数据被视为推动AI技术革新的“新石油”。在这一变革的背后,合成数据扮演着至关重要的角色,成为AI进入物理世界的桥梁。光轮智能,这家专注于合成数据的创业公司,凭借独特的技术视角和商业模式,吸引了全球目光。光轮智能联合创始人兼总裁杨海波,他深入分析了合成数据在AI发展中的核心作用,并分享了公司在具身智能领域的战略布局及成就,以及对未来数据革命的洞察。


图片


从体制内到创业:选择充满挑战的人生


杨海波,在早年间的十年政府工作中,深度参与基层治理、宏观调控和组织管理,深谙中国政策体系与资源调配机制;主导创建多个国家级、北京市级社会组织的经历,使其积累了丰富的资源整合与协同发展经验;在美团负责公共事务期间,结合市场需求,将政策洞察转化为企业发展动能。2023年,看到AI迈入智能涌现阶段、数据瓶颈凸显的机遇,杨海波与他人联合创立光轮智能。这种横跨政府、社会组织与企业的多元履历,让他既懂政策导向,又谙市场规律,是深刻立足国情、着眼科技创新的资深专家。


“我的人生理念就是要拥抱和享受不确定,只有不断追求变化,才是真正的成功。”杨海波坦言,“相比过去在不同政府机关部门、各类社会组织和大厂的工作经历,创业更具挑战性,每天都要面对不确定,每天都在从0到1思考和解决问题。”


“中国实体经济正处在具身智能发展的关键期,但许多企业受限于具身数据积累,难以实现突破,光轮智能希望通过仿真技术打造具身数据引擎,将AGI推广到千行百业。”杨海波说道,“创业虽然充满挑战,但我相信这是一条难而正确的路。”


合成数据是具身智能的必经之路


杨海波认为,合成数据,是具身智能发展的必经之路。他将合成数据形容为“人类示范的放大器”。“机器人的学习过程类似于人类,从模仿到自我迭代,而合成数据的价值在于,将人类示范转化为海量训练素材。”而具身合成数据有四个必备条件:一是要有足够真实的物理交互能力、二是要有人的示范在环、三是场景足够丰富、四是要实现数据闭环验证。


“具身智能的核心首先是建立物理交互能力。”杨海波表示,“与传统AI(比如大语言模型、自动驾驶)不同,就像掌握游泳技能需要亲身体验水流变化而非仅观察动作分解,要让机器人具备类人学习能力,就必须模拟出真实的物理反馈。”物体的轻重、软硬材质、碰撞时的反应、关节活动规律,以及动作之间的逻辑关系(例如按下开关灯才会亮)等,通过这些真实的物理交互,机器人才能在训练中总结经验,逐渐优化算法。


此外,杨海波强调人类示范不可或缺。他指出:“纯粹的AI生成数据违背了第一性原理,打造数据‘永动机’不现实,只有结合人类专家的示范和洞察,合成数据才能发挥最大作用。”OpenAI借助数千名专业标注员提炼人类反馈,Scale AI则有数万名博士、工程师等专家标注员,特斯拉的FSD V12/13基于“五星级驾驶员”数据进行自动驾驶训练——具身同样需要专家的遥操作数据作为种子,再通过仿真泛化出多样化的操作范式,填补99%的具身Pre-Train(预训练)阶段的数据缺口。


图片

杨海波在中国人形机器人与具身智能产业大会上做合成数据主题分享


“足够丰富的场景多样性极其重要,大家都在谈Sim2Real Gap,却忽略了Real2Real在场景丰富度上的巨大Gap。”作为具身合成数据的第三个必备条件,杨海波阐述了拥有足够丰富的场景的重要性:自动驾驶在封闭测试环境中训练的再完善,也无法应对真实路况,本质是测试场场景复杂度不足。目前,多数具身数据采集仍然采用先搭硬件场景再收集数据的模式,这种硬绑定方式既难以应对硬件快速迭代,又受限于有限场景规模,导致成本高、效率低。具身合成数据的核心优势在于能够灵活生成百万级差异化场景,通过低成本大规模覆盖合理数据分布,这才是支撑算法训练的关键基础。


图片

光轮智能面向具身智能训练场景的资产与场景积累示例


在谈到数据闭环验证时,杨海波特别点出:“我们与英伟达合作,通过光轮合成数据去Finetune与Sim2Real落地,将GR00T N1模型成功部署到汽车制造生产线上。”这一成果不仅展示了光轮支持模型Finetune和Sim2Real落地的能力,更体现了对合成数据“闭环验证能力”的高度重视。合成数据只有具备闭环验证能力——也就是生成的数据能训练算法在真实场景中落地,并通过模型微调和性能回溯持续验证其有效性,它才真正具备价值。光轮正是通过这种闭环验证机制,持续强化合成数据的质量与模型的真实适应能力。


图片

光轮智能在英伟达的技术分享会上作报告


商业模式的创新:做AGI时代的“卖水人”


光轮智能的商业模式也颇具创新,与传统的软件供应商不同,光轮智能选择直接“卖数据”。杨海波表示:“我们要做AGI时代的‘卖水人’,客户需要的不是仿真工具,而是即用型的高质量具身数据。”这一模式紧贴客户需求,也为公司带来了稳定的现金流。


他说,实现这一愿景,技术能力是基础,但运营能力同样至关重要。“成为领先的数据供应商,光靠技术是不够的。”杨海波指出:“我们借鉴了Scale AI在数据标注和运营方面的经验,将技术与运营深度融合,打造了一条高效的‘具身合成数据产线’。”产线连接了人类专家示范与仿真技术,确保了数据从生成到交付的流畅衔接。


商业与技术创新的共振效应正在显现,截至2025年年初,光轮智能已经服务英伟达、Figure、DeepMind、智元机器人、银河通用机器人、字节跳动、Wayve、博世等众多全球顶尖企业、主机厂及Tier 1供应商,稳居国内合成数据市场份额第一位,并成为全球技术领先的具身智能合成数据供应商。


光轮智能未来的蓝图


杨海波对合成数据的未来充满信心。“随着AI模型复杂度的提升,数据需求只会越来越大,特别是在具身智能领域,合成数据将占据主导地位,将达到90%甚至99%的份额。”然而,他也清楚地认识到,行业面临着技术标准的制定、物理交互精确模拟和与多样化硬件平台适配等挑战。


“我们的目标是成为顶尖的合成数据提供商。”杨海波坚定地说道,“为此,我们将持续加大研发投入,吸引一流人才,增强技术运营能力。”未来几年,公司将聚焦合成数据赛道,加速国际化布局,作为合成数据领域的持续领先者,成为驱动全球AI革命的重要力量。


尾声


在AI技术飞速发展的今天,数据的角色从未如此重要。在这场数据革命中,光轮智能正在以先行者的姿态,引领行业走向更加广阔的未来。


特刊 | 该文章由光轮智能提供,非《财富》(中文版)编辑内容,文责自负。


在财富Plus,网友们对这篇文章发表了许多有深度和思想的观点。一起来看看吧。也欢迎你加入我们,谈谈你的想法。今日其他热议话题:

查看《5月LPR报价出炉:5年期和1年期利率均下调10个基点》的精彩观点
查看《国家发改委发声,事关稳就业稳经济政策、整治内卷式竞争》的精彩观点