具身智能是指依靠物理实体通过与环境交互来实现智能增长的智能系统。此前,人工智能主要以数字形式存在,缺乏视觉、触觉、听觉等感官体验,难以有效应对现实世界的各种情况。而具身智能通过赋予AI“身体”,与现实产生交互,使AI从数字世界走向物理世界,被认为是迈向通用人工智能的重要一步。
其实,具身智能并不是一个新概念,早在1950年,“计算机科学之父”图灵就在其论文中提出具身智能的概念,但在过去几十年间并无太大进展。
近2年,随着AI技术的突破,具身智能又再次备受关注。在2023年的半导体大会上,英伟达创始人兼CEO黄仁勋便表示,人工智能的下一个浪潮是具身智能。2024年云栖大会上,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭表示,生成式AI最大的想象力不在手机屏幕,而是改变物理世界。这意味着,将AI在数字世界与物理世界连接的具身智能在未来必将深刻影响各行各业的发展。
具身智能可拆分为“具身”+“智能”,“具身”是指具有身体且可通过交互、感知、行动等能力来执行任务,按使用用途和场景的不同,具身智能可以有多种形态,包括各类智能机器人、自动驾驶等。机器人是具身智能的主要应用场景,其中人形机器人被认为是具身智能最理想的形态。“智能”是指物理实体可主动进行感知、理解、推理、决策、行动等任务。与此前的机器人相比,具身智能更强调在环境中的交互能力。可见,具身智能应同时具备“本体、环境交互、智能”三要素。
数据来源:各企业官网、来觅数据整理
AI大模型的出现与硬件成本的下降,助推具身智能向好发展。当前,学术界和业界普遍认为具身智能主要由大脑(AI大模型)、小脑(运动控制)、硬件身体三部分构成。
AI大模型大幅提高了机器人的语言交互、环境感知、任务决策等关键能力,帮助机器人与人类进行对话交互并做出决策,机器人小脑则控制机器人的运动、身体感知与平衡。AI大模型并不能完全等同于机器人大脑,因为AI大模型需要经过训练、微调后才成为机器人的大脑,但在AI大模型的加持下,机器人更加“聪明”,可以执行更复杂的任务,包括炒菜、洗衣服等。同时,大模型仍处于快速进步阶段,2024年9月12日,OpenAI发布新模型o1,首次证明语言模型可具备“人脑的慢思考”能力,且该模型的推理能力已达到理科博士水平。预计,不断进步的大模型也将推动机器人在更多领域实现应用。
除了AI大模型使机器人开始拥有“大脑”外,机器人硬件成本的下降,也助推了机器人行业的快速发展。以人形机器人为例,据高盛测算,人形机器人的单位制造成本已从2022年的5万-25万美元下降至3万-15万美元,下降幅度约40%,且呈现不断下滑的趋势,这为人形机器人的量产奠定基础。
具身智能已是全球主要国家的重点发展方向。现阶段,全球多个国家对具身智能的发展均予以重视。
国内方面,北京、上海、深圳等地区相继出台政策,将具身智能列为人工智能重点发展方向。例如,2023年发布的《上海市促进智能机器人产业高质量创新发展行动方案(2023-2025年)》明确表示要重点攻关具身智能等先进技术,打造具身智能开源开放平台;2024年北京海淀区发布《打造全国具身智能创新高地三年行动方案》,旨在打造全国具身智能原始创新策源地、应用示范新高地和产业加速集聚地。
海外方面,美国多所知名高校及通用电气Vernova联合发布最新版美国机器人路线图,旨在加强美国在机器人领域的市场竞争力;韩国出台多项政策支持机器人(如2023年的《机器人发展战略》)、自动驾驶(如2021年的《首尔自动驾驶蓝图2030》)等具身智能相关核心技术的创新。
多家企业布局具身智能领域,推动产业快速进步。在各国政府的大力支持下,众多企业也加入具身智能领域,推动具身智能的感知、交互、决策、行动等能力持续提升。现阶段,具身智能领域的主要参与者可分为3类,即机器人企业、汽车企业、互联网科技企业。
(1)机器人企业:已拥有机器人技术的积累,近3年来不断加强机器人与人工智能技术结合,推出更加智能的各类机器人。例如,优必选人形机器人Walker S在2024年4月接入百度文心大模型进行任务调度应用开发,进一步探索AI大模型+人形机器人的创新应用;
(2)汽车企业:自动驾驶汽车属于具身智能的一种形态,在自动驾驶技术进步使成本不断降低的背景下,以萝卜快跑为代表的自动驾驶汽车已逐步开始商业化。同时,部分汽车企业也自研机器人,如特斯拉自研的Optimus人形机器人,预计将在2025年部署到工厂;
(3)互联网科技企业:该类企业拥有较强的资金实力,且视觉感知、算法、虚拟仿真等软件方面具有明显的优势,可选择直接布局具身智能赛道,或通过投资的形式间接布局该赛道。例如,腾讯通过RoboticsX机器人实验室研究多模态大模型与机器人的融合,小米通过自研CyberOne人形机器人直接布局具身智能领域,微软、OpenAI、亚马逊、三星等多家企业则参与投资人形机器人初创企业Figure。
具身智能市场规模
具身智能市场具有良好的发展前景。据Virtue Market Research数据,2023年全球具身智能系统市场规模为35亿美元,预计2030年达到94亿美元,年复合增长率达15.2%。其中,北美、欧洲、亚太地区的市场份额合计超过85%。全球具身智能系统市场规模保持增长态势的主要因素如下:
(1)政策支持:全球主要国家陆续出台一系列政策支持具身智能的发展。例如,2024年9月,北京市发出首张“具身智能机器人食品经营许可证”,智能机器人可进入餐饮市场。为此,海淀区市场监管局制定了“餐饮服务智能机器人”的管理规范和47项监管项目,确保机器人安全上岗;
(2)技术进步:人工智能、机器学习、计算机视觉、自然语言处理和机器人技术等快速发展为具身智能的落地奠定基础。同时,认知科学、神经科学、机械工程和材料科学等多学科交叉融合,推动具身智能的感知、交互能力;
(3)市场需求:随着人口老龄化、劳动力成本上升,社会对具身智能的需求不断增长。例如,在医疗保健领域,手术机器人可帮助外科医生以更高的精度执行微创手术,减少患者术后恢复时间。同时,康复类机器人也帮助患者进行物理治疗,提供个性化的护理和实时反馈。
具身智能面临的挑战
(4)法律与伦理挑战:具身智能机器人造成损害时,确定责任归属较为复杂,现有的法律和监管框架尚不足以应对具身智能带来的新挑战。同时,人工智能与机器人技术进步会改变就业市场、社会互动和人类行为,此前高盛的报告指出,人工智能预计会取代3亿个全职工作岗位。如何更好应对社会结构的变化和就业模式的转变,也是监管面临的难题。
据来觅PEVC数据显示,2024年以来,在国内,作为具身智能重要领域之一的人形机器人的融资事件共31起(含未公开事件),合计融资金额超36亿元。其中,约74%融资事件处于A轮及以前阶段,这也表明人形机器人行业尚未成熟,仍处于早期发展阶段。
此外,人形机器人领域展现一定的头部效应。例如,智元机器人自2023年共获得6轮融资,已披露融资金额累计超过17亿元,估值已超70亿元;宇树科技在今年2月份获得近10亿元的B2轮融资,在9月又获得数亿元的C轮融资。
下表展示了2024年以来人形机器人赛道亿元及以上的融资事件,感兴趣的读者可以登录Rime PEVC平台获取人形机器人赛道全量融资案例、被投项目及深度数据分析。
数据来源:来觅数据
具身智能展望
具身智能的多模态感知能力逐步增强。具身智能的核心能力之一是模仿人类的感知能力,其需要通过视觉、触觉、听觉等多种传感器融合多模态数据。在3D摄像头、激光雷达、触觉传感器等各类传感器技术不断进步的背景下,具身智能产品感知系统的分辨率、精确性将不断提升,各类传感器之间的融合与协作也会更加智能化,具身智能产品可更高效处理多模态信息。
具身智能的应用场景持续拓宽。具身智能在医疗、教育、物流、教育等多个领域展现了巨大的应用潜力,例如手术机器人提升手术操作时的精准度、教育机器人为学生提供个性化教学内容等。随着具身智能技术不断成熟,其将可在更多领域实现更深度的应用,并推动行业的创新和转型。
本文内容基于来觅数据认为可信的公开资料或实地调研资料,我们力求本文内容的客观、公正,但对本文中所载的信息、观点及数据的准确性、可靠性、时效性及完整性不作任何明确或隐含的保证,亦不负相关法律责任。受研究方法和数据获取资源的限制,本报告全部内容仅供参考之用,对任何人的投资、商业决策、法律等操作均不构成任何建议。在任何情况下,对因参考本报告造成的任何影响和后果,来觅数据均不承担任何责任。