对话|小鹏自动驾驶负责人李力耘:“我们不再是这条路上的孤勇者”

图片

用一套软件提供全系标配的高阶智驾,不收费、不订阅。

文丨赵宇‍‍‍

编辑丨宋玮‍‍‍‍

今年 10 月,小鹏自动驾驶副总裁李力耘、自动驾驶产品高级总监袁婷婷和何小鹏开了一次年度规划会。“我们几乎是迅速达成了共识”,加入小鹏刚四个月的袁婷婷说。

何小鹏在这次会议中说了三个 “一定”:一定会持续加大对于智驾的投入;一定会坚持走 AI 路线,让 AI 赋能小鹏所有的产品线;一定会坚持走全球化道路,让智驾产品服务全球的小鹏用户。

李力耘说,他和何小鹏的日常沟通形式之一,就是何小鹏在群里不断报新软件版本的 bug,或者报惊喜,他来解决。但他们的目标是一致的、不需要讨论的,“以当前 L2 的 Bom 成本为所有用户提供类似 L3 的智能辅助驾驶体验,做到不限城市、不限工况、不限路况。”

李力耘 2019 年加入小鹏汽车。此前,他曾在百度美研、京东美国硅谷团队研发无人车。2020 年,他把家从美国搬回广州。

在小鹏前自动驾驶副总裁吴新宙去年 8 月离职后,李力耘接棒成为自动驾驶研发一号位。他在两个月内完成 “疯狂 200 城” 计划,今年 1 月将小鹏无图城市 NGP 的覆盖范围扩展至全国 243 座城市。

但不久之后,李力耘就迎来了更大的挑战。

一方面,特斯拉在北美推出 FSD V12 版本,率先用 “端到端” 重塑量产智能驾驶的算法架构,智能驾驶行业的技术风向再次发生转变,国内其他厂商意图借此机会实现弯道超车。

另一方面,小鹏内部的智驾人才流失。近一年,除吴新宙外,至少有 5 位小鹏智能驾驶技术高管加入英伟达。而吴新宙曾在去年 7 月告诉我们,小鹏的智能驾驶方案之所以总是能够按照规划好的时间迭代版本,技术只是一部分原因,更重要的是团队、体系。

今年 5 月以来,何小鹏多次强调,小鹏是国内首家、全球唯二实现端到端大模型量产落地的车企——另一家是特斯拉。

但也有业内人士提出质疑:特斯拉的端到端方案,从感知到决策都采用一个模型(one model),而国内厂商往往采用 “分段式” 端到端模型。虽然在决策模块内部用数据驱动取代了一些规则,但整个流程里还是有大量规则,因此不够先进。

小鹏很快嗅到危机,随后在组织架构、人才招募、算力储备等方面做出一系列调整:

  • 将研发团队改组为 AI 模型开发、AI 应用交付、AI 效能三个部门;

  • 从 Cruise、Waymo 等美国 L4 级自动驾驶研发商招揽高级人才;

  • 加大云端训练资源储备,计划到明年底将算力扩张至 10EFlops 以上。

李力耘告诉我们,小鹏在今年 5 月量产的端到端大模型也属于 one model 架构,因为 “三张网络互相交叠、重合,且彼此之间采用神经元连接,而不是通过规则定义结构接口”。

本周,小鹏就将发布天玑 5.4.0 系统。相比 5 个月前的版本,智能驾驶的算法架构和用户体验有望升级,或将影响中国智驾行业竞争格局。

以下是《晚点》和李力耘、袁婷婷的对话。

智能驾驶是算法、算力、数据的全方位比拼

《晚点》:智能驾驶已经开始影响中国消费者的购车决策,根据你们的观察和感受,影响的程度有多大?

李力耘:智能驾驶现在即使排名不在前三,也比较靠前。一款售价在 30 万元以上的车,如果不具备高阶智驾能力,吸引力就很有限,并且这个趋势正逐渐向 20 万元价格带渗透。

《晚点》:理想带有高阶智驾功能的 Max 版本选装率过半,其中 L789 车型 Max 版本的选装率超过 70%。小鹏当前的高阶智驾版本选装率如何?

李力耘:小鹏 X9 车型 Max 版本的选装率目前在 73% 以上。除了选装率,我们还会关注全方位指标,包括每一个版本智驾功能的启用率、用户渗透率、里程渗透率。5 月,端到端大模型量产上车后,小鹏 XNGP 城区智驾月度用户渗透率基本保持在 83%-86%。

《晚点》:X9 是一款起售价在 35 万元以上的车型,售价比 X9 更低的 P7、P5、G9 和 G6 车型 Max 版本的选装率如何?

李力耘:从即将在 11 月上旬上市的 P7+ 这款车开始,小鹏的高阶智驾会在全系车型上标配,以后也就不存在选装率的问题。

我们会以一套软件来提供全系标配的高阶智驾,届时所有新车型高阶智驾版本的选装率都会是 100%。

袁婷婷:用一套智驾软件标配全系车型,这是一件很难的事情。虽然我们只是讲了这么几个字,但其实需要很强的能力积累。这是大多数厂商想做而实现不了的。

《晚点》:特斯拉就坚持用一套智驾软件标配全系车型,其智能驾驶能力也在行业中领先。有人认为,原因之一是特斯拉车队规模更大、可供训练的数据量更大。国内的一些厂商也将车队规模和数据量作为竞争优势。对此你怎么看?

李力耘:不能说完全是无稽之谈。一家车企的基本盘就是你有多少车、算力投入有多少。但这不是完全等效的。特斯拉之所以领先,是因为它在自动驾驶三要素(算法、算力、数据)上都做到了领先。

第一,车队规模是一个很重要的基础,但是它不直接代表你的训练数据有多少,因为只有高质量的驾驶数据才有用。一是车端数据质量要高,二是要有很强的工程能力,甚至在车端就需要算法或者 AI 介入,否则即使有再多的数据,能不能有效利用也是一个问题。

第二,其实小鹏也有多样化的数据,这是更有利的。我们小鹏的车从 A 级到 B 级到 C 级,从轿车到 SUV 到 MPV,车型覆盖更加丰富。这些都决定我们在高质量数据上,以及高效地利用算力上,都是国内 Top。当然,跟特斯拉比,我们承认仍然存在差距。

《晚点》:车队回传的大量数据一般需要在云端处理,关于云端算力的扩展,特斯拉计划今年花费数十亿美元购买 AI 芯片,理想今年在智能驾驶云端算力方面的支出超过 10 亿元人民币,将来可能达到 10 亿美元。小鹏在云端算力方面的投入如何?预计未来会增长到多少?

李力耘:考虑到小鹏参与的是全球竞争,到 2025 年底,我们的云端算力会达到 10EFlops 以上,相比 2024 年的规划增加 2.6 倍。

但实际上,我们不应该比拼算力的绝对数字,就好像不应该单纯比拼 Orin 芯片上能部署多少参数的模型,因为这和量化、模型结构等选择很有关系。在算力方面,我们除了关注绝对值,还要关注利用率。小鹏云端训练集群的利用率常年保持在八九成以上的水准。

《晚点》:可供模型训练使用的数据量与销量紧密相关。今年 1-9 月,小鹏累计交付新车 9.9 万辆,少于理想、蔚来零跑等国产新势力车企。

袁婷婷:何小鹏之前说过一句话,我非常认可,他说 “我们看的不是这一个周,也不是这一个月,看的是最后的结果。”

李力耘:如果说我们完全不关心短期销量,肯定是假的。但是相比短期销量,我们更关心终局:高阶智驾全系标配之后小鹏在全球市场的发展,以及小鹏如何从 L2 走向 L3、L4。

《晚点》:为了促进销量增长,陆续有国产厂商开始采用 “高阶智驾终身免费” 的市场策略。何小鹏近期也说,小鹏 P7+ 的智能驾驶软件不收费、不订阅。这是否意味着小鹏以后也会跟随这一策略?你认为智能驾驶收费这条路在中国能走通吗?

李力耘:这个问题非常尖锐。现阶段,小鹏借助 AI 大模型,已经可以用合理的 Bom 成本为给用户提供接近自动驾驶的体验,即便硬件仍然是 L2 级别,以此实现科技普惠。

既然是普惠,我们希望软硬件标配,不收费且不订阅。无论是小鹏的自动泊车,还是停车场的记忆行驶,或者高速和城区的智能辅助驾驶,以及带点个性化的 AI 代驾,小鹏都会采用这样的模式。至于这是否意味着智驾收费这条路在中国走不通,我们没有考虑这个问题。

《晚点》:高阶智能驾驶功能之所以要收费,一个重要原因是硬件成本高,激光雷达就是其中一个成本项。对于一款车是不是搭载激光雷达,有哪些因素在影响小鹏的决策?

袁婷婷:我们的业务决策并不完全是从成本上来考虑的。第一,端到端落地后,小鹏的技术能力有很大的提高,让我们有信心提供这样的产品。第二,我们有能力做到平台化,把高阶智驾的能力搭载到旗下所有车型上。

李力耘:客观上来说,激光雷达确实是一个比较昂贵的精密仪器。但它其实也比较容易坏,且对天气很敏感。比如我自己的车就会在下雨天气出现部分功能不可用的情况,或者出现 “幽灵刹车”。但这并不是说激光雷达不好,我们也没有完全抛弃主动传感器。

在我们看来,无论是激光雷达,还是毫米波雷达,都属于主动传感器。主动传感器虽然好,但是人类开车并不需要主动传感器——人类的眼睛是一个被动传感器,因为光产生反应,我们的眼睛才对大脑有信号。本着第一性原理,我们和特斯拉一样,希望以轻雷达、轻地图的方式,做到 “全国都好用”。

但是我们没有抛弃主动传感器,我们也没有说一定会完全抛弃激光雷达。有了激光雷达,可以做出更好的功能。即使没有激光雷达,我们也会使用毫米波雷达、超声波雷达等主动传感器。它们其实在物理学上跟激光雷达没有本质区别,都是发射、接收。

《晚点》:刚才你们提到,小鹏的车型覆盖多个级别、多个种类,所以能收集更多样的数据,这对小鹏的智能驾驶研发有利。但对比特斯拉,他们只有两款主销车,model 3 和 model Y。

李力耘:其实有多样化的数据是更有利的。小鹏虽然车型五花八门,但智驾是平台化的。平台化并不是说,每款车都要长成一个样,类似套娃,只是大小不同。对于不同车型,小鹏在特定的传感器选型、算力配置方面,也秉持平台化的思路。

当然,为了 “平台化” 短短三个字,小鹏做了很多工作,包括软件的发布链条、算法模型的通用适配等。它需要做到对每款车型都适用,之后每增加一款新车型,只需要做一点补充的数据采集,而主模型非常通用、泛化。这让小鹏的驾驶数据里既有偏大车的驾驶数据,也有偏小车的驾驶数据,包含更丰富的用户行为。

“我们不再是这条路上的孤勇者”

《晚点》:小鹏研发端到端,和特斯拉去年四季度在北美推出 FSD V12 版本的关系有多大?

李力耘:我们的变化并不是因为 FSD V12。当然 FSD V12 更加让我们感到欣慰,因为我们不再是这条路上的孤勇者。

从突破上来看,FSD V12 最大的特点在于,V12.5 版本的体验会提升非常多。我们明显地看到,由于数据驱动,FSD 进化的加速度在变快。

《晚点》:小鹏在自动驾驶技术路线方面跟特斯拉是一致的吗?

李力耘:不能说小鹏完全跟特斯拉一致,但是大家都是朝着同一个方向在努力,即以数据、AI 为核心生产力,来驱动智能辅助驾驶的发展。

只不过,小鹏身处国内激烈的竞争环境中,我们更需要以产品功能的推陈出新为导向,所以我们此前使用了高精地图、使用了规则算法,这都是为了先给小鹏的用户提供尝鲜体验。

《晚点》:从今年初到现在,小鹏在 AI 方面最大的技术架构调整是什么?

李力耘:今年初以来,小鹏智能驾驶既有技术架构的调整,也有组织架构的调整。从技术的角度,端到端听起来很容易,但其实很难,稍不注意就会走错路。

早在 2022 年,我们率先完成城市导航辅助驾驶在国内一两个城市的落地。当时我们就在想,是不是需要更多地提升泛化能力,因此在 2022 年 4 月,小鹏就开始了端到端 AI 化的研发。

从那时开始,对于传统自动驾驶中感知、融合、预测、规划、控制和定位等小的模块,我们已经在做一些 AI 化的尝试,用规则的逻辑把它牵引起来。此外,我们也尝试在车端部署端到端模型。

到了今天,我们的认知上升了一个层次,会更看重类似 ChatGPT o1 这样部署在云端、更强的大模型,并且在智能驾驶领域做我们的实证和 Specialization(定制化)。然后,我们推出了现在这样一个 “三网合一” 的架构,其中 XBrain 类似于人的大脑、XNet 类似于人的眼睛,XPlanner 类似于人的肌肉和小脑。

其实,这不是一个分段式的架构,因为三张网络是互相交叠、互相重合的,他们在网络原生层面有很多共享的部分,是一个既有侧重、可以分开预训练,又可以联合训练的网络。

小鹏的 “三网合一” 端到端架构,注重安全,各有侧重。事实上,华为和小鹏两家的端到端架构有很强的相似性。华为的端到端架构中也有一个感知网络、一个规控网络,以及一个本能安全网络。其实大家都希望既能够充分利用 AI 的能力,同时也希望算法模型有很好的可解释性,这样便于管控。如果真的完全用一个 AI 开车,端到端中间是一个大黑盒,将是一件非常挑战的事情。

《晚点》:你是说,小鹏现在已经量产的端到端智驾版本,不是分段式,而是 one model?

李力耘:对,我们是 one model,这是我们想澄清的。我们是一个 one model,但是这个 one model 不代表在训练的过程中就要整体搭建出来。这类似于拼一个复杂的机器人,它有两条腿、两只手,还有一个身体,这些部分可以预装,然后联合调试。这是我们的方法论,因为我们对云端一个更大的 one piece 模型有很好的认知。我们为了把端到端做得更可解释、可管控,才选择这样的方式。

袁婷婷:分段式是先完成 A,A 的箭头指向 B,B 的箭头指向 C。我们现在做的 “三网合一” 模型有三个圆,它们其实是耦合在一起的,既有重合的部分,又有分开的部分,并不是各自做一张网。因此它不是分段式的逻辑,可能此前大家有一些误解。

李力耘:如果说得更基础一点,网络之间是通过神经元连接的,而不是通过规则定义一个结构接口,然后往里面一条条地添加规则。其实这是一个很大的模型,但是由于算力的限制,现在是用两块 Orin 芯片,我们需要做一些预训练跟组装。

《晚点》:之前业内有声音认为,必须是从感知到轨迹输出都用一个模型,才叫 one model。如果感知模块先输出一个结果,再去做决策规划,就不是 one model。

李力耘:对,因为那样的一个 one model,它中间的某些部分可能是不可解释的。使用 “三网合一” 的架构,我们仍然可以通过调试,看问题具体是出在哪个方面。

我们更重要的投入,是一个云端的基础大模型(foundation model)。因为这个模型部署在云端,不受算力的影响,它会是一个当前车端模型 80-100 倍大小的模型。我们的 “三网合一” 架构是一个基于第一性原理,既有算力的妥协,又有可控性的实际考量,从高维到低维的一个技术呈现。

《晚点》:从分段式到 one model,这个跨越的难度有多大?

李力耘:小模型的级联,也就是通过规则把小模型牵引起来,这跟原来的每一个模块用优质算法工程师的规则写,需要的能力都是类似的。

以前的规则或者小模型时代,我倾向于将其比喻成冷兵器时代,它局限于解决自己模块的问题,没有全局的考量和训练。所以在这个阶段,无论规划模块,还是感知模块,都会有自己的算法工程师来解决问题。在当时,我们更希望这些武林高手有很好的数学能力、一定的模型能力、好的业务理解,这样他们就能把分配到自己领域的问题解决。

但是到了 one model 时代,需要用端到端的方式来解决问题,其实就相当于从冷兵器时代变到热兵器时代,不再是希望找一些武功高强的人组成一只部队,万军之中取上将首级,而是通过云端算力、车端算力的部署,加上大量数据,通过训练模型来解决问题。这更像在热兵器时代,我们要通过开采矿物、冶炼钢铁、造枪造炮、排列部队阵型,去赢得胜利。

所以在端到端时代,解决智能辅助驾驶问题变得更难,因为整个链条变得更长。从单点来看,不排除有一些组织力很强、特别有资源的厂商能够跟上这个转型,但是对于更多车企和供应商,端到端之后的智能化竞争其实变得更难,既需要人才厚度、密度,也需要算力、大量数据,还需要更长的工程链条。以前,只需要每个模块有一些武林高手,现在需要有一个流畅的工程体系,用来每天承接数以百万甚至千万计的数据,把它们流转成算法。

《晚点》:端到端落地之后,各家厂商都逐渐把大模型部署到车端。国内有些厂商称其参数量为 20-30 亿,小鹏车端大模型的参数量是多少?

李力耘:参数量这个东西具有一定的欺骗性,因为一方面要看你的量化维度是怎样的,另一方面也要看你解决问题的方式。如果用越大的参数量去解决越小的问题,反而显示不出技术能力。

袁婷婷:我们不评价友商大模型的参数量大或者小,但我们能够确认两点:第一,小鹏在云端的算力还在以几何级数增加。第二,无论是云端大模型,还是车端大模型,小鹏整体的参数量是引领行业的,具体数值我们不方便现在就公布。

“周期短、见效快的端到端方案,类似于预制菜”

《晚点》:我们今天谈论的很多内容都关于端到端,但在去年下半年,国内厂商都还在研究怎么做无图城市 NOA、比拼开城数量。今年以来,端到端热度陡然升高。这个节奏是否超出你们的预期?

李力耘:端到端其实很容易走错方向,像我们之前提过,小鹏和华为的方向大致一致的,是正确的。然而有的厂商会有一些混淆,把一些小模型通过规则的连接看成是端到端,或者直接做一个车上的端到端模型,其实这些都会有问题。例如,借助规则堆砌小模型来做端到端,会导致你仍然需要大量优秀的规则工程师;如果是在车上部署一个端到端模型,短期内可能见效很快,但是它长期的能力会受限于模型本身的大小。

在双 Orin 芯片上能够布置的模型大小是有物理极限的,这对于每家车企都是一样的。如果 AI 的基础架构和云端的数据飞轮只局限于双 Orin 能够承载的模型,显然是一个短视的行为,未来会遇到更多的瓶颈。小鹏是更拔高地看这件事情,一定要先在云端有一个更强大的模型,无论是从模型的数量、参数的数量,还是数据量上,都要有几何级数的增长。在此基础上,我们再来做车端模型的选型跟部署。

《晚点》:你曾说,端到端就像一座冰山,外界能看到的是水面以上的 5%,但更重要的是水面以下的 95%。具体应如何理解这句话?

李力耘:大家看到的水面以上的 5%,更多集中在车上的能力,包括驾驶行为更加拟人化、算法更加模型化。但是,水面以下 95% 的部分,其实是把这个模型运行起来,更多的工作在于花大量的人力、物力和财力,去采集数据、标注数据,挖掘和存储数据。因为这些数据是海量的,要把它流转起来,让它进到机器学习系统里,系统要在若干天内迭代一个版本,然后这个模型还要经过验证、量化,部署到车上。

原来可能遇到的问题集中在水面以上,只需要工程师设计一个新的算法,或者拍脑袋想出一个更新颖的数学模型,就能把问题解决。现在解决问题需要走更长的流程:找到类似的高质量数据,加强模型在这块的理解,然后把它印在脑子中,不再局限于设计算法。整个链条变得更长,工作变得更重。

《晚点》:现在不同厂商对于端到端的定义有所不同,如果简单描述你认为的端到端是什么?

李力耘:我是第一性原理的忠实信徒。在我看来,真正的端到端在设计上一定要以终为始,以人类的方法论开车——人有自己的眼睛、肌肉、大脑,并且都在一个结构中完成。但是端到端毕竟要考虑算力在车端的部署,这时候要脚踏实地,并且能够做到更可控、更安全。

现在不同的智驾团队都发展端到端,但会选择不同的发展路线。主流路线现在分为三种:一种是通过大量规则小模型堆叠的 “大模型”;一种是 “车端大模型”;还有一种与 OpenAI 一致的云端大模型。

“车端大模型” 的特点是见效快,但是上限低,随着后期训练的数据量增加很容易遇到瓶颈,有可能面临重新设计,小鹏曾考虑过这个路线。

我们笃定地选择,把云端大模型(foundation model ) 做大做好,用云端大模型蒸馏部署到车端模型的方式。云端大模型是决定能力上限的关键,它会有几百亿参数,甚至千亿级参数,这是车端模型的几十甚至上百倍,是只做车端模型远不能及的。

小鹏的云端大模型不只服务于自动驾驶,更是国内首个泛机器人领域的基础大模型。它能够实现一套模型架构,甚至一套环境数据输入,用于训练小鹏生态中的一系列产品,涵盖自动驾驶 / 智能座舱 / 机器人 / 飞行汽车等。

从终局来看,这才会是制胜关键。

《晚点》:相比以前基于规则的方案,端到端在技术开发上的难点主要在于哪里?小鹏是怎么克服这些难点的?

李力耘:以前,我们更希望有一组冷兵器时代的优秀算法工程师,让他们去解决每一个模块的问题。但现在,由于它变成了一个更长的链条,我们转而希望有系统性思维的人,他对技术的演进有自己的思考,看重的能力点从对数学的直觉变成对数据的直觉、对数据效率的直觉。

研发端到端时,很多时候是非常有趣的。比如,设计端到端的神经网络,它更像一个实验科学——工程师需要设计各种各样的神经网络结构,然后去做实验,看怎么样才能够解决实际问题。

端到端落地之后,我们要处理更海量的数据,也要更高效地处理数据。我们笃定:慢就是快,一定要等待火候上来,把更大的锅做好,把更多的燃料堆好,才能做出上限更高的端到端方案。

所以在某种程度上,周期短、见效快的端到端有点像智能驾驶的预制菜,但是我们不想受到这样的瓶颈约束,更希望能够有一个更高的认知,自上而下地做这件事。

《晚点》:端到端带来的变化给一些原本进度落后的厂商带来了弯道超车的机会吗?

李力耘:端到端由于链条更长,实际上变得更难。原来,一家厂商为了补足能力,招一个好的规划 Lead、一个好的感知 Lead,或者一个好的定位 Lead,就可以搞定这件事,因为他们可以很快带来算法结构的提升。

现在解决问题需要大量收集好的驾驶数据,然后把这些数据做标注、处理、挖掘,然后提供到训练平台中。此外,还要有很好的模型结构、很大的算力,才能训练出模型、部署到车上。整个链条变得更长,其实对于厂商的要求变得更高,所以弯道超车会变得更吃力,第一梯队厂商跟后面厂商之间的差距会拉得更开。不排除有个别厂商因为转型非常坚决,可以实现弯道超车。但是总体上看,这件事会变得更难。

举个例子,就单从数据来看,供应商的数据来源于不同的车企,本身是异质化的。另外采集数据本身需要做得更加高效,然后还要在云端把如此大量的数据运维起来,这些都需要极强的工程能力,而能力需要时间培养。

在端到端之前,如果一家厂商没有积累,但是能够把工程能力补上,就可以直接产生业务效果。现在,一家厂商把工程能力补上,只是让它有积累数据的可能,所以端到端整体变得更难。

以 AI 为核心招揽人才、调整研发组织架构

《晚点》:去年 8 月吴新宙突然离职,你接手小鹏自动驾驶中心负责人这个职位。当时你是如何稳定军心的?

李力耘:正常的人员良性流动,对整个行业是有利的。我们也在持续吸引更好的人才,包括我们的 AI Lead,也包括你们这次见到的产品 Lead 婷婷。

回溯到去年 8 月,那时我们正在推进 “全国都能开”,属于小鹏智驾 AI 化的初期。后面我们做的所有东西,其实都是在拥抱 AI 这样一个新质生产力带来的变革。这种变革不以谁主持小鹏自动驾驶中心而变化。

《晚点》:何小鹏当时让你带领整个团队,具体是怎么跟你说的?

李力耘:事实上,我是从新宙那先知道这件事情的。

《晚点》:你和何小鹏平时是如何沟通的,沟通频率怎样?

李力耘:他会第一时间给我们报新软件版本的 bug,或者报惊喜。现在这也成了我们之间沟通互动的方式。

《晚点》: 何小鹏之前说,小鹏今年在 AI 研发方面的投入一共是 35 亿元人民币,其中有多少是用到智驾方面?

李力耘:整个是非常大的投入,具体多少会用到智驾方面,我不能说出具体的数字。何小鹏给我最大的感觉是,他是 “因为相信,所以看见”,愿意先投入,然后期待结果,而不是说一定要有什么样的结果出来,他再去投入。

袁婷婷:这笔投入也包含小鹏其他的 AI 研发板块,但智驾的确是其中最重要的部分。

《晚点》:团队架构上,端到端对于智能驾驶的感知、规控等不同部门造成了什么影响?有业内人士认为,端到端落地后,规控部门变得没有以前那么重要,这个说法你认同吗?

李力耘:完全不是这样。我们在 8 月份做了组织架构的调整,原来小鹏的技术部门也有预测、规划、定位、感知、控制等串行模块的技术部门,现在我们已经把组织架构调整成以 AI 为核心,新组建了 AI 模型开发、AI 应用交付、AI 效能三个部门,希望充分发挥 AI 的生产力。

如果我们把组织架构看成生产关系,生产关系总是要适配生产力的变革。虽然这些冷兵器时代的武林高手不再是直接解决问题的关键,但是,一来他们的 domain knowledge(基础知识)能够很好的去帮助模型选择数据,在规划方面尤其如此;二来他们对于应该用什么样的数据设计什么样的模型结构,以及怎么做仿真验证,都有巨大的用处。

我们希望内部激发那些原来冷兵器时代的优秀人才做转型,把他们培养成新时代的 AI 人才。

小鹏没有去裁人,没有说规则的工程师不再重要,而是觉得他们具备的基础知识可以很好的地指导 AI,因为 AI 在发展早期仍然需要人类老师。这是小鹏跟一些急功近利的车企很不一样的地方,希望这点也能帮助我们吸引到更多人才。

《晚点》:近期有消息称,小鹏计划扩充 Robotaxi 团队,正在高薪招聘有全球一线 Robotaxi 公司工作经验的员工。可以分享一下小鹏对 Robotaxi 业务的总体规划吗?

李力耘:Robotaxi 业务其实会跟随小鹏整体的车型发布节奏。2026 年,小鹏会推出自己的 Robotaxi 车型,我们提供软件和硬件能力,但不会去做运营。

无论是云端大模型,还是世界模型,或者生成式仿真、强化学习,这些都是最终做成 Robotaxi 的必由之路。端到端的 AI 大模型也许不是最终做成无人驾驶的充分条件,但会是一个必要条件。如果没有极强的泛化能力、场景处理和博弈能力,很难高性价比地把 Robotaxi 的能力作为一个运力产品提供给外部。

《晚点》:今年 7 月底,何小鹏说,“经过最近几个月,我非常相信端到端是未来,不仅把 L2 干出来,将来还要把 L4 干出来”。你认为小鹏距离实现 L4 级自动驾驶还有多远?有人说,端到端无法直接实现 L4。要实现 L4,需要 “世界模型”(world model)或者更先进的算法模型,对此你怎么看?

李力耘:如果不把端到端 AI 大模型做好,等到未来去做 L4,其实是一件性价比不高或者很有挑战的事情。至于在做好端到端之后,能不能直接达到 L4,我认同你说的,可能我们还需要做世界模型,以及强化学习领域的自我博弈(Self-play)等。

《晚点》:假设有一天,小鹏没有能达到心目中 L4 的终点,可能是什么原因?

袁婷婷:我是不做这个假设的。悲观的人也许正确,但是乐观的人能走到最后。

李力耘:小鹏一定是最坚持的那一家厂商。我相信我们一定能够最终看到 AI 真正改变人类的出行方式。

《晚点》:有一部分观点是,要成为一家真正的 AI 企业,就必须自研人形机器人,小鹏内部也这样认为吗?

李力耘:这个问题很有趣。我们现在并没有说要做 AI 企业,就一定要做人形机器人。自动驾驶和机器人在方法论上比较接近,它们都是对大量复杂不确定环境的博弈。汽车有四个轮子和方向盘,就已经很复杂、很难用规则写;人形机器人有那么多关节,更难用规则写。两者的相通之处,可能是都会用数据、用端到端模型来驱动。

题图来源:《洛奇》