刘少山:万字长文解析“具身智能”数据产业发展前景|AI观察

AI划重点 · 全文约8306字,阅读需24分钟

1.具身智能正成为推动新一轮产业变革的重要力量,预示着数字经济向自主经济迈进的新趋势。

2.场景驱动型增长在经济价值创造中发挥着关键作用,然而,当前具身智能数据面临着数据复杂性与“数据孤岛”现象的双重挑战。

3.作者提出了“万物皆可达”与“万物皆可生”的数据采集与生成技术路线,强调提升数据广度与质量的重要性。

4.围绕产业发展瓶颈,创新性地提出了“标准化→资产化→交易化”的三步走策略,为产业发展提供了清晰、务实的落地框架。

以上内容由腾讯混元大模型生成,仅供参考

编者按 ·  2024.03.17


具身智能(Embodied AI)正成为推动新一轮产业变革的重要力量,预示着数字经济向自主经济迈进的新趋势。这一前沿领域的突破高度依赖高质量数据的支撑,而传统互联网时代积累的数据模式正逐渐向以真实场景为核心驱动的模式转变。


本文系统探讨具身智能数据产业的演变与未来发展路径。具身智能数据产业的演进路径表明,场景驱动型增长在经济价值创造中发挥着关键作用。然而,当前具身智能数据面临着数据复杂性与“数据孤岛”现象的双重挑战。为此,作者提出了“万物皆可达”与“万物皆可生”的数据采集与生成技术路线,强调提升数据广度与质量的重要性。同时,围绕产业发展瓶颈,创新性地提出了“标准化→资产化→交易化”的三步走策略,为产业发展提供了清晰、务实的落地框架。




具身智能数据的经济价值重构:

从互联网范式到场景驱动型增长


具身智能(Embodied AI)正推动社会从数字经济向自主经济演进,其核心在于对高质量数据的深度依赖。数字经济通过用户数据积累创造价值,而自主经济依托具身智能在物理世界中的自主感知、决策与执行,使数据从信息载体转变为塑造智能能力的核心要素。具身智能数据的质量、广度和多样性比规模更为关键。


对比互联网经济与具身智能在数据价值创造机制上的本质区别——前者依赖用户规模驱动流量变现,后者则以场景覆盖率和数据真实性为核心驱动力。



(一)具身智能的数据需求范式革命


随着技术发展推进数字经济向自主经济转变,数据要素始终扮演着基础性生产资料的角色。特别是,随着人工智能技术范式的迭代升级,新兴具身智能对数据的需求已呈现结构性转变。基于此,有必要通过对比分析互联网行业与具身智能领域的数据利用模式,揭示两者在价值创造机制上的本质差异。


在互联网经济范式中,数据的价值实现遵循规模效应路径。企业通过用户画像构建实现精准广告投放与个性化内容推荐,这种商业模式的成功依赖于三大核心机制:其一,海量的用户交互数据支撑机器学习模型的持续优化;其二,基于注意力经济的用户黏性提升;其三,数据要素的二次流通变现。据统计,互联网单用户数据估值可达600美元,而全球50亿网民由此催生出3万亿美元的互联网数据产业。


与互联网行业的数据积累逻辑显著不同,具身智能系统的价值创造主要遵循场景驱动型路径(Scenario-driven Model)。这种差异源于两类智能系统的本质区别:互联网平台通过标准化服务实现用户规模扩张,而具身智能设备需在物理世界中完成复杂的环境交互任务。


具体而言:


1. 场景适应性要求:机器人系统需应对家庭护理、工业制造、医疗救援等多元应用场景,这对数据集的领域多样性(Domain Diversity)提出刚性需求。以服务机器人为例,其训练数据需涵盖物体识别、语义理解、空间导航等跨模态任务。


2. 本体感知复杂性不同形态的机器人(人形机器人、四足机器人、无人机等)搭载的传感器阵列存在显著差异,导致数据采集维度呈现高度异构性。例如,工业机器人侧重力反馈数据,而医疗机器人则需高精度生物信号采集。


3. 决策鲁棒性需求: 在动态物理环境中,具身智能系统通过强化学习等技术实现从感知到执行的闭环优化,这要求训练数据具备足够的真实场景覆盖度与环境干扰模拟。


表1中笔者总结了互联网经济与具身智能领域在数据价值创造机制上的本质差异:互联网范式以用户规模为核心驱动力,通过匿名化数据的大规模积累实现短期流量变现,其商业价值主要体现在基于用户画像的精准营销和数据二次流通交易;而具身智能范式则以场景覆盖率和数据真实性为关键维度,强调多模态场景数据的采集与本体感知数据的深度融合,通过强化学习驱动长期技术迭代。


这种差异导致两者在数据质量标准(互联网侧重匿名化处理,具身智能强调环境真实性)、价值实现周期(互联网追求即时收益,具身智能注重技术累积效应)及战略投资方向(互联网依赖用户增长,具身智能聚焦场景适配)上形成显著分野,凸显了具身智能作为下一代数据经济支柱的独特发展路径。


图片

互联网经济与具身智能的数据价值鸿沟体现在三个维度(图源:作者)



(二)具身智能数据市场

的经济潜力测算


基于马斯克提出的“未来机器人数量将超过人类”的预测,可以构建针对具身智能数据市场的量化分析框架。如图1所示,在这一框架下,若假设每台机器人未来的平均成本为三万美元,并将其中约3%用于数据采集与处理,则单台设备的“数据成本”约为一千美元。而多个预测具身智能的市场饱和时,全球部署量将超过一百亿台,单凭基础的数据投入就可能形成总规模达十万亿美元的庞大市场。该数字与当前互联网数据市场相比,呈现出巨大的增长空间,也预示了具身智能数据可能成为推动下一轮经济变革的关键。


图片

图1:具身智能数据产业规模预测(图源:作者)


然而,具身智能数据的价值并不仅限于设备与训练本身,还会通过多种衍生机制得到进一步放大。


首先,通过对高质量训练数据的深度运用,企业能够持续改进机器人算法,使之在感知、决策和执行等方面表现出更高的准确度与灵活性。这种性能提升所带来的差异化服务溢价,可以帮助厂商在市场竞争中赢得先机,也能吸引更多客户和合作伙伴投入到相关生态体系中。


其次,企业可通过对外开放数据接口或提供数据授权的方式,与其他硬件、软件或服务提供商进行协作,从而在生态协同中实现新的收入来源。无论是工业场景下的机器人协作,还是消费端的家庭服务机器人,各类企业都对多模态、高质量的数据有着旺盛需求,而通过数据共享平台或API授权收费,企业不仅能获得直接收益,还能推动行业标准化进程。


最后,在数字孪生、仿真测试和虚拟现实等新兴领域,数据驱动型创新正在快速崛起。机器人采集的场景数据可被用于创建逼真的虚拟模型,让研究人员或第三方开发者在不影响真实生产或服务环境的情况下对新算法进行迭代测试,或开展更全面的安全评估和性能验证。这种虚实结合的应用模式可显著降低试错成本,并让具身智能在更广泛的垂直领域获得落地机会,进而为整个数据产业带来更大增量。


由此可见,在基础数据投入与数据衍生服务的结合之下,具身智能数据产业所能带来的价值远不止于模型训练或功能升级的层面,而是有望形成一个覆盖产业链上下游、广泛影响各个行业的全新经济生态。



具身智能数据的双重挑战:

数据复杂性与数据孤岛


在剖析了具身智能数据的经济价值,阐明了其与互联网范式之间的显著差异之后,我们要进一步探讨具身智能数据在大规模应用中所面临的关键挑战——包括其多维复杂性与数据孤岛现象,并揭示这些问题对技术迭代与产业协同发展的深层影响。



(一)具身智能数据的复杂性


在具身智能研究和应用实践中,机器人所产生和使用的数据呈现出高度多样化和复杂化的特征。笔者通过图2汇总了具身智能数据来源可根据不同的分类标准进行细分,每一种分类方式都揭示了具身智能系统内部或外部环境中所面临的独特数据挑战。


图片

图2:具身智能数据的复杂性(图源:作者)


1. 本体构型


首先,从本体构型的角度出发,固定基座机器人主要应用于工业产线或实验室环境,移动机器人在仓储、农田或恶劣环境中自由移动,复合机器人则兼具固定和移动的能力,还存在大量特种作业机器人、医疗机器人或模块化机器人,需要根据具体任务和使用场景来灵活设计和部署。由此可见,本体构型的多样性直接影响了数据采集的传感器类型、任务复杂度以及数据处理模式。


2. 数据类别


除了本体构型,具身智能的数据类别也异常丰富。若按照数据的性质区分,可以划分为机器人内部数据与外部数据两大类。机器人内部数据覆盖运动、感知和决策等核心环节,还包含与导航或参数配置相关的信息;机器人外部数据则涵盖在真实环境中产生的交互记录、标注数据、遥操作数据乃至地图数据。不同的数据类别不仅决定了数据处理算法的复杂程度,也对底层硬件和软件系统的兼容性提出了更高要求。


3. 应用领域


进一步来看,应用领域的差异同样使数据获取与管理面临巨大的挑战:工业机器人关注生产效率和质量控制,服务机器人侧重用户体验和人机交互,医疗机器人强调精确性与安全性,农业机器人侧重对环境适应能力的要求,特种机器人或多机器人协同又各自拥有不同的场景和通信需求。面对如此繁杂的应用场景,任何单一类型或规模的数据都难以支撑具身智能在跨领域的泛化和迭代。


4. 数据的采集技术


与此同时,机器人数据的采集技术仍在不断演化。真实数据主要来源于实际操作和示教学习过程,仿真数据则通过生成类或合成类技术在虚拟环境中模拟物理或人机交互场景。两种方式相辅相成,一方面真实数据具有高度可信度,另一方面仿真数据有助于快速迭代和规模化测试。


5. 技术路线


最后,从技术路线的视角出发,当前的具身智能大致分为“分层决策”和“端到端”两种主要模式:分层决策注重将“大脑”和“小脑”功能区分处理,“端到端”模式则倾向于“视觉—语言—动作”的直接对齐,并通过执行数据和人工标注来获取训练集。不同技术路线对数据的需求重点各不相同,直接决定了具身智能系统对外部环境和自身状态信息的获取方式。


综上所述,无论是本体构型、数据类别、应用领域,还是采集技术与技术路线,具身智能的数据来源都体现出复杂、多维和动态的特点。正因为这些维度彼此交织、相互影响,才使得具身智能的数据采集与生产比传统互联网更具挑战,也更具创新潜力。



(二)具身智能“数据孤岛”现象


除了数据本身的复杂性外,具身智能领域的“数据孤岛”现象也成为制约技术发展的核心瓶颈:在缺乏统一行业标准的前提下,数据集定义高度碎片化,不同机构所开源数据集的格式及协议往往互不兼容,导致数据处理成本攀升;技术路线的差异更使数据复用面临严峻挑战——仿真数据与真实场景的物理偏差,以及动作捕捉与机器人实机适配的构型对齐需求,形成“数据—算法—硬件”组合差异性的恶性循环,严重阻碍了技术协同创新。


此外,产业生态的封闭性进一步加剧了这一问题:机器人市场虽具多元化格局,却缺少统一的数据共享机制,客观上造成数据资源分散和割裂;现有开源数据集普遍专注于单一场景或简单任务,难以满足多本体与长程任务的泛化训练需求。


在此背景下,数据孤岛的危害愈发凸显。即使整合了70余个独立数据集的Google Open X-Embodiment,由于格式混乱,其有效数据利用率依然不足50%,导致整体训练效果不及小规模专用数据集。这种数据通用性的缺失使得技术迭代陷入“低水平重复”,而产业生态的碎片化又导致数据资源呈指数级扩散,进一步加深了数据孤岛态势,从而对具身智能技术的商业化进程与产业生态构建带来根本性挑战。


为了估计具身智能数据孤岛问题的潜在影响,笔者借鉴互联网时代的经验,数据被封闭在孤岛中不仅导致潜在价值无法充分挖掘,还会增加研发成本、合规风险并削弱创新活力。IDC的研究显示,多达68%的数据因孤立而被浪费。而美国数据产业智库the Data Literacy Project的研究报告则指出绝大部分企业将数据孤岛视为提升数据利用效率的最大障碍。这些问题在具身智能领域同样适用,如果缺乏统一的标准与共享机制,大规模、多源异构数据难以形成合力,势必对技术与生态的规模化发展构成深远挑战。



具身智能数据采集

与生成技术路线


基于这些亟待突破的瓶颈,我们需要聚焦具身智能数据采集与生成技术路线,特别是“万物皆可达”与“万物皆可生”这两大理念,提出一条从数据采集到生成的完整技术路线(见图3)。


其中,“万物皆可达”强调通过多种采集设备和跨场景的数据收集手段,保证信息的广度与多元性;而“万物皆可生”则通过仿真及合成技术,不断衍生并扩展数据规模与深度。两者相辅相成,既为真实世界的多样性提供坚实支撑,也使虚拟环境中的大规模训练和测试成为可能,最终为具身智能在更广泛的真实与虚拟场景中实现持续进化奠定基础。


图片

图3:具身智能采集与生成技术路线(图源:作者)



(一)具身智能真实世界数据采集


为了实现“万物皆可达”的目标,具身智能数据平台必须在兼容性、自动化和可扩展性方面形成有力支撑,从而提高数据的场景覆盖率和采集效率。兼容性是平台的基础,通过统一标准化的接口和模块化架构,使得不同类型的硬件设备(如机器人本体、传感器、VR设备、动捕系统等)能够无缝接入,打破了硬件壁垒。以具身智能开源数据平台AIRSPEED平台为例,其轻量级中间件能够管理多个数据流,在同一架构下整合多种数据源,如遥操作、机器人本体传感器和示教数据采集,极大提升了数据采集的灵活性和广度,使得不同硬件的协同工作更加高效,确保数据覆盖更多真实世界场景。


自动化则是提升数据采集效率的关键。通过将数据清洗、标注和质量控制等环节集成到自动化流程中,平台能够显著降低人工干预成本,并提高数据的可靠性和一致性。GRUtopia 2.0平台便通过自动化场景生成与数据采集机制,每天可以生成超过15,000条高质量的轨迹数据。这种自动化处理能力使得数据采集过程更加高效,并减少了人为误差,提高了数据的适用性与可复用性。


可扩展性为平台的长期发展和大规模部署提供了保障。具身智能数据平台能够在云端或边缘环境灵活扩容,支持更多设备和应用场景的接入。AgiBot World平台通过自建的大规模采集工厂,将数据采集规模提升至传统平台的十倍以上,这使得平台能够应对大规模、多设备的任务需求。扩展性的优势不仅保证了平台在多任务环境下的稳定性,也为产业化应用提供了坚实的技术支撑,使得具身智能能够跨越实验室阶段,进入更多实际应用场景。


只有通过兼容性、自动化和可扩展性的协同作用,具身智能数据平台才能够有效实现“万物皆可达”,提升数据采集的场景覆盖率,最终为具身智能技术的落地与产业化铺平道路。



(二)基于仿真环境的

具身智能数据生成


虽然真实世界数据至关重要,但许多场景的数据采集成本依旧高企,因此仿真数据在规模化与极端场景中具有不可替代的优势。基于仿真环境的具身智能数据生成依赖于三个核心要求:数据多样性、精确物理仿真和成本效益。


首先,仿真平台必须能够快速生成多样化的场景和任务数据,并支持不同机器人型号和任务参数的灵活配置。例如,NVIDIA Isaac平台通过高质量的视觉渲染和动力学模拟,能够在多种应用场景(如仓储、制造等)中生成丰富的训练数据,极大地提升了数据的泛化能力。类似地,MuJoCo平台专注于高精度的动力学仿真,特别适用于复杂的运动学任务,如多物体操作和高动态交互。


图片

NVIDIA Isaac Sim™ 基于 NVIDIA Omniverse™ 构建,可在基于物理的虚拟环境中设计、仿真、测试和训练基于 AI 的机器人和自主机器

(图源:developer.nvidia.cn)


其次,仿真平台需要提供精确的物理仿真,确保虚拟环境中的物理交互接近现实世界。这一点在Isaac Sim中得到了充分体现,它集成了强大的动力学引擎和传感器模拟,能够精确地模拟机器人与环境的互动,支持在极端条件下的高效测试和验证


最后,仿真平台必须具备成本效益,即能够在减少硬件投资和维护成本的同时,降低数据采集和标注的开销。平台如Isaac Sim通过自动化数据生成和标注,减少了人工干预,降低了数据采集的整体成本。这使得仿真环境能够在保持高真实性的同时,大规模生成数据,从而显著提高数据采集效率,为具身智能技术的广泛应用提供了强有力的支持。


为了估计具身智能数据仿真对成本的大幅优化,笔者借鉴了自动驾驶的经验,如上图3所示,在自动驾驶行业,每小时真实世界数据获取的成本为180美元一小时,而每小时仿真数据的获取成本则为2.2美元一小时,有将近100倍的成本优化。由于具身智能与自动驾驶技术栈与仿真方式的相近,笔者预测基于仿真的数据合成相对于真实世界数据采集将有相似的效应。



具身智能数据产业

发展“三步走”建议


尽管技术方面的突破至关重要,但要想真正推动具身智能数据产业发展,还需要在行业层面构建系统化的发展路径。基于此,我们提出“具身智能数据产业发展三步走”建议:首先,通过“具身智能数据标准化”打破孤岛、建立共享基础;随后,通过“具身智能数据资产化”激活数据价值、驱动持续投入;最后,构建“具身智能数据交易市场”,以形成完善的产业生态并加速行业迭代。这三大步骤彼此呼应,共同为具身智能的数据经济与产业落地提供了切实可行的实践蓝图。



(一)具身智能数据标准化

——打破孤岛,建立共享基础


随着具身智能技术的快速发展,数据标准化已成为推动行业发展的核心要素。目前,数据孤岛现象严重制约了技术协同和产业化进程。不同平台和设备间存在数据格式、协议和传输方式的差异,导致数据共享和复用困难。因此,建立统一的数据标准是打破孤岛、构建具身智能产业共享基础的首要步骤 。


前面讨论的具身智能数据采集与生成的技术路线为标准化提供了技术支持。通过统一的中间件框架和标准化接口,多个数据源可以无缝连接并转换为兼容的格式。这一技术架构不仅促进了数据共享,还为行业的协同创新和可持续发展提供了有力保障。


在国内,当前具身智能数据标准化的关键领域包括技术架构、能力评估和数据规范。在技术架构方面,《具身智能标准体系1.0》提出了“四横三纵”框架,涵盖基础要素、关键技术、本体产品及应用场景,进一步明确了系统开发的统一技术路线。在能力评估方面,《AIIA/T 0198-2024》细化了感知、决策、行动和交互四大核心模块的能力指标,明确系统应具备的环境感知、任务规划、物理执行和人机交互等综合能力。数据规范方面,《人工智能-具身智能数据采集规范》首次统一了多源异构数据格式,如传感器数据和操作轨迹,从根本上解决了数据孤岛问题。


随着虚实融合技术(如数字孪生)和自动化流程的应用,数据质量正在不断提升。然而,要进一步推动具身智能仿真技术从实验室研究转向实际应用,行业需要在标准建立方面达成广泛共识。虚实融合技术和自动化流程标准化进程的推进,将为具身智能技术的规模化应用提供重要支撑。


图片

2024世界人工智能大会上展出的“十八金刚 众创未来——人形机器人先锋阵列”(图源:新华社)



(二)具身智能数据资产化

——激活价值,驱动持续投入


具身智能数据资产化是激活数据潜力、推动产业持续发展的重要途径。通过将具身智能数据转化为可衡量、可交易的资产,不仅能提升数据的经济价值,还能为企业和行业提供持续的资金投入和技术创新动力。数据作为新的生产要素,其资产化能促使更多资源流向具身智能技术的研究和应用,加速行业发展。然而,数据资产化的实现依赖于标准化和制度保障,因此,具身智能数据的标准化为其资产化提供了基础。


具身智能数据标准化为数据资产化提供了统一的框架和规范,使得不同来源、不同格式的多模态数据能够在统一的标准下进行整合和利用。通过建立统一的数据结构、接口和评估体系,标准化技术为数据的确权、定价和交易奠定了基础。这一过程不仅增强了数据的可共享性和可操作性,还为数据的价值评估和资产化提供了必要的保障。正是因为标准化的推进,具身智能数据可以更容易地被视作无形资产,进入企业资产负债表,参与市场交易。


在我国,数据资产化的政策框架和实践已经逐步展开,提供了推进具身智能数据资产化的政策支持。2023年,财政部发布的《企业数据资源相关会计处理暂行规定》明确了数据资源作为“无形资产”或“存货”进行确权和会计处理的原则。此举为数据的入表提供了政策依据,有助于激活数据的经济价值。此外,地方政府,如北京、上海和深圳,已开展了地方试点,通过建立数据交易平台、支持数据确权和交易,为数据资产化提供了实践路径。


然而,具身智能数据资产化的推进仍面临一些挑战。首先,数据确权问题依然复杂,涉及多个主体和法律框架的完善。其次,数据的估值标准尚不统一,导致市场定价的不确定性。此外,数据资产化可能带来隐私泄露和跨境流动的安全风险,这对企业和监管部门提出了更高要求。地方政策的差异也可能导致跨区域交易的合规障碍。



(三)具身智能数据交易市场

——构建生态,加速产业迭代


在具身智能数据资产化的基础上,具身智能数据交易市场的建立对于推动行业发展具有深远意义。通过构建一个开放、高效的数据交易平台,数据能够在不同主体之间流通,促进数据资源的共享和价值的最大化。


数据交易市场不仅能够激发数据的经济潜力,还能够推动创新。通过对数据的交换与整合,推动具身智能技术的快速迭代和应用创新。首先,数据的交换使得不同领域和场景的数据能够相互补充,提供多样化的训练样本。具身智能系统需要大量来自不同设备和环境的数据,如视觉、听觉、触觉等多模态数据,而这些数据往往由不同的实体或机构生成。通过数据交换,不同平台间的数据可以共享,为算法模型提供更广泛的训练数据,提升其在复杂环境中的适应能力,进而推动技术的不断进步和优化。


此外,数据交易能够打破不同数据源之间的孤立,为算法的优化和模型更新提供了基础。例如,在机器人感知系统中,融合来自不同传感器的数据可以提高机器人对环境的理解能力,促进多感知信息的协同处理,使得机器人能够更准确地进行决策和执行任务。通过这种数据交易,能够推动具身智能技术的跨领域应用创新,如将工业机器人的技术应用到医疗、物流等其他领域,从而扩展了具身智能的应用范围和技术潜力。


为了评估具身智能数据交易市场,笔者借鉴了互联网产业BDEX数据交易平台的经验。BDEX通过实时交互和标准化治理,构建了高效的数据流通体系,推动数据市场化。自2014年上线以来,其交易量持续增长,吸引Sony等企业入驻,覆盖广告、零售等行业。平台依托API接口实现即时数据调用,满足动态商业需求,并通过“BDEX身份”标记化技术建立统一数据标识体系,结合实时监控确保数据流通可追溯,降低数据孤岛问题。BDEX不仅提升数据流通效率,还为具身智能等新兴领域提供可复制的数据交易范式,以技术互操作性和生态开放性最大化数据价值并推动产业协同创新。



本文作者

刘少山:深圳市人工智能与机器人研究院具身智能中心主任,世界青年科学院院士(Elected Member,Global Young Academy)。


*原创声明:本文版权归微信订阅号“大湾区评论”所有,未经允许任何单位或个人不得转载、复制或以任何其他方式使用本文部分或全部内容,侵权必究。公众号授权事宜请直接于文章下方留言,其他合作事宜请联系

IIA-paper@cuhk.edu.cn。

*免责声明:本文所阐述观点仅代表作者本人立场,不代表大湾区评论或IIA机构立场。

GBA Review 新传媒

校对 | 杨芸淞 

初审 | 覃筱靖 

终审 | 冯箫凝