分析丨成立8个月估值24亿，这家机器人公司拿什么吸引了投资人？

AI芯天下

2024-11-15 20:30发布于广东

·聚焦:人工智能、芯片等行业

欢迎各位客官关注、转发

前言：

目前，两条路径正在同步推进。一些人形机器人公司专注于构建硬件，并侧重于训练机器人全身运动的控制能力，而另一些厂商则采取垂直一体化的策略。

同时，还有其他公司致力于构建世界模型或通用模型。Physical Intelligence代表了第三种路径。

作者 | 方文三

图片来源 | 网络

PI成立8个月估值24亿美元

据《纽约时报》报道，美国机器人初创企业Physical Intelligence近日成功完成了四亿美元的融资。

此次融资的主要投资者包括亚马逊创始人杰夫·贝佐斯、风险投资公司Thrive Capital以及Lux Capital，而OpenAI、Redpoint Ventures和Bond亦参与了投资，使得公司在投资前的估值达到了二十亿美元。

Physical Intelligence是一家致力于将通用人工智能技术应用于物理世界的新兴企业，目前正致力于开发能够驱动当前机器人技术及未来物理设备的基础模型和学习算法。

该公司于今年三月在美国特拉华州正式注册成立，总部设在旧金山。

成立仅一个月后，Physical Intelligence便从Khosla Ventures、Lux Capital、红杉资本、Thrive Capital和OpenAI等知名投资机构成功筹集了七千万美元的资金，当时公司的估值约为四亿美元。

Physical Intelligence官网介绍称，该公司致力于将通用人工智能技术引入现实世界。

π0模型的训练过程分为两个阶段：预训练和微调。

在预训练阶段，模型通过学习大量数据来掌握广泛的知识和技能，以便适应各种不同的应用场景。

随后，在微调阶段，模型针对特定任务进行优化，以提升在这些任务上的性能表现。

此外，π0模型采用了流匹配技术，使其能够处理连续的动作序列，而不仅仅是单一的、离散的步骤。

结合其混合专家架构，这一技术的应用显著提高了模型在预测动作时的准确性。

谷歌斯坦福伯克利大佬领衔的团队

公司的联合创始人兼首席执行官Karol Hausman，曾担任Google DeepMind的资深研究科学家，并兼任斯坦福大学的兼职教授。

Chelsea Finn，斯坦福大学计算机科学与电气工程系的教授，同时也是Google Brain团队的前成员，其研究兴趣集中在如何通过学习使机器人和其他智能体变得更加智能。

Sergey Levine，加州大学伯克利分校电气工程与计算机科学系的助理教授，专注于研究自主智能体通过学习获得复杂行为的通用算法，尤其在机器学习决策和控制领域有所建树。

Brian Ichter，曾是Google Brain的研究科学家，并在斯坦福大学获得博士学位，其研究方向是通过学习提升移动机器人在现实环境中执行任务的能力。

π0模型具有以下三大优势

①π0模型展现了优秀的跨平台及跨任务迁移学习能力。

该模型通过融合视觉、语言和动作数据，实现了从物体分类到动态操控的多样化技能。

其训练数据集涵盖了来自八种不同机器人的交互数据，以及开放的图像和文本数据集，这使得π0能够在不同的机器人和任务平台上进行迁移和适应。

这种跨平台的兼容性赋予了π0处理多种不同机器人配置的能力，包括单臂机器人、双臂机器人和移动机械臂，从而显著提升了模型的通用性和适应性。

②π0模型在任务处理和指令执行方面表现出色。它能够通过[零样本]方式执行任务，即在没有特定任务样本数据的情况下完成指令，这在动态环境中尤为适用。

同时，π0还支持[微调]功能，可根据具体应用场景进行数据增强训练，以提升复杂任务的执行效果。

这种灵活性和适应性使得π0能够应对各种复杂任务，如叠衣服、收拾桌子、组装盒子等，并在这些任务中表现出色。

③π0模型采用了独特的技术架构和方法。它基于视觉-语言模型（VLM）构建，通过整合视觉、语言和动作数据，实现了复杂任务的操作。

在动作输出模块，π0运用了一种基于扩散模型变体的[流匹配]方法，该方法通过对连续运动指令的建模，实现了高频动作控制。

这种高频控制确保了机器人在动态任务中具备灵活的运动调整能力，从而提高了操作的流畅性和准确性。

与OpenAI志同道合使其获得巨额融资

Physical Intelligence与OpenAI一样，致力于从模型和数据层面打破传统技术的局限。

①ChatGPT的精确语义理解能力是其核心优势之一，对于π0模型而言，这种能力同样至关重要。

π0模型必须具备理解物理世界交互指令和上下文的能力，这涵盖了视觉、语言和触觉等多种感官输入。

②ChatGPT的优秀之处在于其能够将宏观问题拆解为微观问题，并巧妙地整合答案。

对于π0模型而言，这意味着它需要将复杂的物理任务拆解为一系列可操作的步骤，并根据环境的实时反馈灵活调整其行动，以确保实现既定目标。

③ChatGPT的通用性体现在其能够将人类知识迁移到语言交流中。

相比之下，Physical Intelligence的通用性则体现在其能够将从互联网规模数据中学习到的深层语义知识，成功应用于物理世界的实际操作中。

总体而言，ChatGPT之所以成为一个重要里程碑，是因为其在理解及生成自然语言方面展现出优秀的能力；

而Physical Intelligence之所以吸引投资者的关注，关键在于其对物理世界的深刻理解和操控技巧。

结尾：

在现实世界中，让人工智能执行诸如洗衣、叠衣、包装等简单任务，对于当前的人工智能技术而言，并非易事。

实际上，人工智能要真正理解物理世界的系统性工程，仍面临诸多挑战。

然而，要实现所谓的AGI，人工智能必须走出黑盒，进入现实世界。

在这一过程中，机器人，尤其是人形机器人，被视为人工智能在人类设计的社会环境中最佳的载体，这使得人工智能能够具备通才通用性，从而使人形机器人能够真正服务于人类。

部分资料参考：雷锋网：《贝索斯领投、OpenAI连续跟投，这家机器人公司再融4亿美金》，AIGC最前线：《Chelsea Finn带队的Physical Intelligence成果来了》，机器人前瞻：《28亿！又一机器人公司完成巨额融资，OpenAI和贝佐斯都投了》，Robot猎场备忘录：《估值约150亿！具身大模型初创公司最新成果：机器人通用基础模型[π0]》，人形机器人场景应用联盟：《4亿美元巨额融资！具身智能机器人创企估值飙升至170亿》

本公众号所刊发稿件及图片来源于网络，仅用于交流使用，如有侵权请联系回复，我们收到信息后会在24小时内处理。

查看原图 512K