腾讯新闻《远光灯》
作者|傲敦
编辑|刘鹏
小鹏汽车自动驾驶负责人李力耘的OKR几乎是业内公开的秘密。
“小鹏说的每一个字都将是我的OKR。”去年1024科技日上,接手小鹏汽车自动驾驶团队仅两个月的李力耘首次以新身份亮相,当晚他立下军令状:2023年,XNGP要开通50个城市;2024年,实现全国能用、全国好用。
九个月后,也是接手自动驾驶团队一年的时间点,李力耘带领团队提前并超额完成了OKR。7月30日,何小鹏在AI智驾发布会上宣布,XNGP将从“全国都能开”正式升级为“全国都好用”,实现了“不限城市、不限路线、不限路况的”全国全量开放。
小鹏汽车成立的2014年,也是李力耘正式投身自动驾驶行业的年份。他曾是百度美国研发中心最早一批投身自动驾驶的人,负责无人车行为预测系统和智能决策规划系统的整体架构及算法;2018年短暂在京东硅谷研发中心X实验室工作一年后,2019年6月他正式加入小鹏汽车,初期担任智能驾驶决策规划算法和模拟器方向负责人,主要负责小鹏汽车高速和城市自主导航辅助驾驶系统NGP的研发;去年8月,前小鹏汽车自动驾驶副总裁吴新宙转战英伟达,作为XNGP项目负责人,李力耘正式接棒。
与过往任何阶段不同,李力耘带队小鹏智驾团队的这一年,是大模型激烈搅动智能驾驶赛道的一年,身处其中的每个人和每一家公司似乎都正在经历一场蜕变。而就在上个月,小鹏汽车自动驾驶中心完成了最新组织调整,面向AI和端到端,新设AI模型开发、AI应用开发、AI效能开发三大板块职能。
7月30日AI智驾发布会前和十周年发布会后,腾讯新闻《远光灯》独家对话李力耘,回望这一年,他认为最重要的事情还是人,把组织和人激活好、调顺,“有了这样完整的组织,能让每个人发挥自己的长处,在大家齐心协力下,才逐渐完成了我们的目标”。
谈到何小鹏如何直观了解内部自动驾驶的进展,李力耘举了一个例子来说明: “其实很简单,就是把相对稳定的、最新的软件推送给大师兄(何小鹏),或者内部其他同事的车上,通过试驾他会看到小鹏汽车在智驾能力上的进步跟进化”。
在访谈过程中,李力耘先后说了近20次“笃定”。他认为,从终局看,最终能够有智驾能力的车企应该很多,但可能大部分都是六七十分,真正做到八九十分以上的,一定是非常笃定的、自研的、有很强中后台能力的、真正面向AI化改革的车企。“我们相信可能全球范围内只有几家,而小鹏会是其中的一家。”
以下是腾讯新闻《远光灯》与李力耘的对话实录,经编辑:
“一整年来看,最重要的事情还是人”
腾讯新闻《远光灯》:何小鹏本人一直是all in智驾的状态,你们日常沟通密切吗?他怎么考核你的工作?
李力耘:我们智驾部门是一个既幸福又非常有挑战的部门,有意思的地方是,我们基本不写PPT汇报。
大师兄怎么直观了解内部自动驾驶的进展呢,其实很简单,就是把相对稳定的、最新的软件推送给大师兄,或者是我、婷婷(袁婷婷,小鹏汽车自动驾驶产品高级总监)和内部其他同事的车上,我们自己先试驾,通过试驾他会看到我们在智驾能力上的进步跟进化。
我和大师兄之间的沟通比你想象得更敏捷一些。我们的软件不是一两周才有一个版本,有时候过几天就会有一个更新或者解决一些问题,或者新增一些小能力,过程中所有稳定的软件版本都会让大师兄体验。
随着我们推最新软件,他也会越开越多,因此我们日常会讨论车的体验,有时候会发现一些新需求或者改进的地方,大师兄也会发现问题会反馈给我们,在这样自然的沟通中,我们也会经常对齐智驾和AI技术的长期投入和规划。
腾讯新闻《远光灯》:这种高频沟通会不会给你带来很大压力?
李力耘:小鹏和所有关心我们的人都能够在第一时间体会到小鹏汽车智驾的变化或者进化,我觉得很幸运、很有趣,这跟我个人经历有关。
我原来在美国读的计算机博士,那个时候人工智能和深度学习是“小荷才露尖尖角”,博士快毕业的时候,神经网络深度学习已经把传统的深度学习全部颠覆了,但是人工智还没有现在这么火。
我从互联网(百度)开始进入职业生涯,但是也非常有幸参与到了中国最早一波智能驾驶或自动驾驶领域。我大概是在2015年、2016年接触到Robotaxi,那时候觉得Robotaxi是非常有意思的事情,但经历一段时间的积累和成长之后,更加激动人心的是,你的工作或者日常的努力、学习跟成长,都能呈现在你眼前,看得见、摸得着,甚至你自己可以去购买的,或者是你的亲人、朋友、同事可以买到的并且能够日常去使用智能驾驶产品,这是特别激动人心的事情。
我觉得Robotaxi更多是偏运营的服务,但是如果自己拥有一辆车是非常激动人心的,这辆车的软件和功能是我们自己一点一滴从无到有开发和迭代的,我觉得这件事很有意思。所以你说压力大吗?我觉得化压力为动力,而更有趣的是碰上了人工智能进一步的爆发,让这件事情逐渐有了更多的可能。
腾讯新闻《远光灯》:你接手智驾团队已经有一年多的时间,可以大概总结一下这段时间的感受吗?
李力耘:这一年挺值得回顾的。一整年来看,最重要的事情还是人。因为把任何事情做好,需要最优秀的团队和人。当然我们也非常幸运,因为小鹏的笃定投入,原来我们已经有很多优秀的同学沉淀下来,也因为我们之前取得一些成绩和业内认可,我们也能吸引到像婷婷,以及更多AI方面的新进优秀人才。
我做的事情其实很简单,但是对我来说是最重要的事情,就是新老结合,把组织和人给激活好、调顺,有了这样完整的组织,能让每个人发挥自己的长处,在大家齐心协力下,才逐渐完成了我们的目标。比如说在去年立的Flag是50个城,其实我们已经超额完成任务,今年1月1号发了243个城,现在我们实现了全国都能开到全国都好用。
今年下半年,大家可以关注后续的1024发布会等,我们更多是以终为始,面向终局的思路,AI一定是终局里面必不可少的,或者我认为它是必经的路径,就是拥抱AI化。端到端其实是AI化的一种呈现,就像小鹏说的,虽然我们的车是L2的辅助驾驶的车,但是明年年底要做到类似L3的体验。
我想强调的是,我们会让用户感受到迭代的速度,每一个月会有小版本,每两个月会有一个相对大一点的版本,确保以终为始的过程中能力是不断上升的。
腾讯新闻《远光灯》:新老结合,具体怎么做呢?
李力耘:一方面是会激发老同学的能力,让他们去履行新的角色。比如,原来的老同学可能是偏中后台的能力,是幕后英雄,但是现在有时候让他去前线做一线业务。这个过程中,他有了新的角色跟生命力,他也成长了。更重要的是,在这个过程中他也带动了周边的人,做了很好的榜样,我们把这个叫做交叉干部培养。现在很多后台幕后的奉献者走到了前台去做一线业务,我觉得整个中心更加有活力了。
更重要的是,随着我们不断地笃定投入和坚持这件事情,我们的业务的仍然在快速取得进步,所以我们能吸引来很多新的AI人才。我觉得现在人才的竞争是非常激烈的,但是非常幸运地能看到小鹏在全球范围内能够持续吸引好的人。
腾讯新闻《远光灯》:小鹏上次调侃说,请各位友商高抬贵手,轻拍少挖。
李力耘:我们只是希望友商“轻拍少挖人”,但更重要的是,我们自身有强大的吸引力,无论是新的人才,包括很多回流的优秀的老同学,这个组织非常有生命力,一代一代的成长。
虽然肯定会有人员流动,但我觉得非常可喜地看到后台的人会踊跃走向前台去承担更大的责任,去迎接更大的挑战,整个组织更加有愿景、有动力,要把智驾这件事情真正做好、做成。
腾讯新闻《远光灯》:最近看到小鹏智能驾团队有了一些架构调整,这背后的思考是什么?
李力耘:是面向AI时代,更为敏捷的组织架构。近期我们自动驾驶中心新设AI模型开发、AI应用开发、AI效能开发三大板块职能,加速AI能力进化和组织AI化转型。
腾讯新闻《远光灯》:未来在人才引进方面,有哪些考量的点?
李力耘:我觉对人才素质和要求方面有一些变化,不像原来那样非常看重domain
knowledge(领域知识)或者是数学规则,更多的是希望年轻、聪明、有AI的背景的人加入我们,又能把业务问题用AI解决的人。到后面,大家拼的是数据和AI效率,所以整个基础架构效率和能力也很重要,所以我们觉得对人的特长、偏好可能会有一定的改变。
组织,做事方式、业务和整个车端的AI渗透全面打通之后,后面的进化会越来越快,快的核心就快在于你对有效数据的获取,然后用有效数据进行迭代的效率的变化。
智驾能力和体验始终要进步,不搞“休克疗法”
腾讯新闻《远光灯》:最近一年大家都在卷端到端,从时间线上看,在这之前,你们内部有没有预判到这个趋势?做了哪些准备?
李力耘:小鹏汽车投智驾是一直非常笃定的,从成立之初开始,就在很重的投入智能化,那时候就有自动驾驶中心,一直成长到今天。现在的投入也是非常笃定,每年我们在AI上的投入达到35亿人民币,人才也是遍布全球。
就端到端而言,其实我们不是说因为别人做出来了,或者因为我们看到了什么,所以跟着去做。对小鹏来说,我们更多的是因为自己相信,所以看见,所以去做,我觉得小鹏汽车是在引领这件事情。
早在2022年初,我们其实就已经开始做相关布局。那时候,我们刚刚完成基于高精地图的城市辅助驾驶功能在几个城市的验证,我们认为真正要做到全国都能开、全国都好用,一定是需要去拥抱AI的能力。
所以从那时候开始,我们就通过AI端到端认知去把路网认好,实现摆脱对高精地图的依赖,然后逐步形成了自己独特的小鹏汽车端到端、小鹏汽车的三网(神经网络XNet+规控大模型XPlanner+大语言模型XBrain),直到今天已经具备全国都能开、都好用的能力,并且实现了全国首个端到端大模型量产上车。
腾讯新闻《远光灯》:从外界感知来看,端到端最早是特斯拉提出来的,马斯克现场直播演示第一个端到端,在那之后,大家在很短的时间内开始跟进。
李力耘:我不否认这个感知,但这只是时间线上,对小鹏汽车来说,拥抱AI是非常笃定的事情。
小鹏汽车是以智能为标签和核心的主机厂,我们要确保产品无论在能力和体验上始终都是进步的,哪怕在端到端推进过程中,也不会去搞“休克疗法”。
小鹏汽车具有两个特征:一方面,我们在AI智驾方面非常笃定;另一方面,在产品推出过程中一定要确保给用户带来不断的体验提升。
在2021年、2022年,我们推出XNGP的前身高速NGP和城市NGP,其实都依赖了高精地图,当时还会强调处理了多少场景,多写了多少行代码,但那个时候我们其实已经有认知,最终要做到全国都能开、全国都好用一定要笃定AI。所以那个时候我们就已经开始去预研、去判断、去做这件事情,但那时候为了保证我们推出的产品智驾体验是逐步上升的,所以仍然是基于高精地图,基于了很重的规则去做的。
所以我不否认这件事情,但至少在中国车企中,我们是非常笃定且最早投入和布局AI端到端的车企。
腾讯新闻《远光灯》:前段时间你们说“FSD很难搞定国内三亿小电驴”,这句话很快就出圈,从技术维度看,你们对特斯拉FSD落地中国有怎样的判断?
李力耘:我们特别尊敬特斯拉,它是全球范围内智能汽车的领导者之一,它在美国做得很好,因为当地路况、道路节奏没有这么复杂,确实在那边开的速度比较快。
但是我觉得,美国路况跟中国路况很不一样,我自己在国外生活了很多年,激烈程度、博弈程度跟国内路况是非常不一样的。在国外,有时候有一些狭窄的自行车道,旁边可能有一些零星骑自行车的人,但是不太可能像我们广州的小电动车各种走;中国很多城市基础设施建设很不一样,有些城市有专门的电动车道、非机动车道,有些城市还没有,非机动车很多时候在跟机动车抢车道,它不仅会在你右边,还会在你左边,有的时候还忽然横穿,还有逆向来的,所以我觉得交通状况非常不一样。
所以我觉得,特斯拉FSD如果来中国的话会有不一样的挑战,我相信,无论从什么地方来,都需要做好中国本地的优化,这是不可避免的过程。
腾讯新闻《远光灯》:6月份小鹏去美国体验完特斯拉FSD,第一时间跟你聊了什么?
李力耘:小鹏第一时间就给我打了电话,他觉得特斯拉进步很快,因为有AI的投入和端到端的能力,进度会很快。
我们聊得很细,聊了很多那边的路况跟国内不一样的地方。比如,美国的高速会开得更快,但是交通博弈没有国内这么激烈,比如说没有3亿小电驴,红绿灯也简单一些。国内红绿灯各种各样、五花八门的,待转区和环岛在美国都很少,但国内路况就更复杂一些,或者有些时候车要去最左边右转,或者要去最右边左转等等。
但我觉得更重要的是,跟小鹏聊完之后,一方面知道哪些地方可以去做得更好,另一方面也坚定了我们自己选择这条路的信心。坚持把研发范式从原来更多的用人和规则驱动,转变成用数据和场景驱动,这会让我们的效率大大提高,所以也更加笃定了这件事情。
小鹏回国后体验过我们的最新版本,他也觉得我们在最新版本上有很多做得不错的地方。比如,拥抱大模型、端到端后,我们在小路、绕行、掉头这种场景表现很好,尤其像掉头,如果你用规则去解决,很难看见掉头的口,对面的东西又是完全没有的,因为是一边开一边看的过程,规则是很难搞定这件事的。
总体来说,我们是既有一点兴奋,也有一些激动,更多的是有使命感跟动力。
腾讯新闻《远光灯》:从520 AI DAY到730 AI智驾技术发布会,小鹏汽车实现了从全国都能开变成全国都好用,827又发布了“端到端四部曲”,请简单介绍一下这背后的思考和实现路径。另外,这是不是意味着,端到端已经是一个公认的、可以持续的技术路线? 未来有无可能出现新的解法和路径?
李力耘:我们现在已经到了全国都好用的阶段,以前很难用规则去覆盖的类似像环岛、掉头、小路等场景我们都打开了。为什么能够这样做?不仅仅是因为渐渐转向用AI数据来驱动解决问题,更多的是我们有非常严谨的验证工程的考量。
全国把地级市、县级市都算上一共有2595个城市,但是在里程上,我们的测试车队实打实地跑了756万公里,这应该是全中国,甚至是全球测试车队里面最TOP的数量级了。我们非常在乎用户用车时的实际安全,我们不仅仅是做到了这个智驾能力,也希望通过验证车队去验证这件事情。
端到端的目标不是端到端,而是为了有效利用数据。端到端的本质是是一种极致的模仿学习,需要数据没有损耗的极致利用。为了实现这个目标,我们的基本策略是:模型精简,打通数据通路,建立更强大的 AI 架构。我们相信依靠端到端的能力,可以帮我们解决道路上绝大多数的corner case,从而实现L3+的自动驾驶体验。
腾讯新闻《远光灯》:在高频率迭代过程中,你们是如何保证这个实际效果的?一线工程师和相关团队的有没有一个硬性规定必须要亲自去体验车?
李力耘:我们可以从高速的NGP说起,那时候我自己还是高速NGP项目的负责人,还不是中心负责人。当时我刚从武汉回来,当时我们每一个人,无论是写算法的、做模型的、做中后台的,做产品的同学就更不用说了,甚至偏供应商管理、供应商零部件开发的,大家都需要去坐这个车,体验完,我们就知道要给用户提供的是什么样的产品。
我在2020年、2021年做高速NGP的时候,因为当时刚回国,回来第一件事就是先把国内驾照给拿到,然后第一件事就是在高速上疯狂地跑。不是说速度疯狂,不敢说全广东的高速都很熟悉,至少全广州高速和周边的高速都很熟,我几乎把每一寸高速都开过几遍,真的把各种各样高速场景以及工况都体验了一遍,也知道了高速NGP对用户的价值。现在你买一辆二三十万的车,如果没有高级的辅助驾驶功能,尤其是在高速环线,这个车可能有些过时了,或者有些功能缺失了。
后面到了城市NGP阶段,肯定不可能每一寸路都开,但是我也跑过非常多的城市,那个时候我和产品测试、研发团队大江南北的跑,基本上长三角、珠三角以及北京周边的城市,每个城市都开过,像市区、郊区、城市和周边卫星城之间的连通路都开过,真的是见到了中国地大物博、路况的复杂。也是那个时候,我们真的觉得如果基于很重经验的高精图是非常难以为继的,所以我们就更加笃定和相信以AI端到端来解决这个问题是一个对的方向。
现在到了全国都能开、全国都好用的阶段,我们更多时候会喜欢去钻一些小路,或者去一些平时覆盖比较低的地方,我觉得挺有趣的。整个过程中,我们鼓励甚至会要求直接跟车相关的无论是算法、模型相关的同学都去坐自己的车,都去体验自己的车。
腾讯新闻《远光灯》:之前开城过程当中,你们觉得哪个城市路况最复杂?端到端之后开城是不是就更简单了?泛化能力更强了。
李力耘:其实我去过很多城市,很多是我自己都没想过会去的城市,比如连州、粤北的一些城市,或者是长三角很多小城市。我觉得它分几个维度。首先是动态部分,不同地方人的驾驶习惯也不太一样,可能有些地方驾驶更加激烈,有些地方驾驶没那么激烈,取决于一些本地的驾驶习惯。
另外,交规里面的礼让行人,在不同地方也都不一样,有些地方是明确写了必须要礼让行人,有些地方好像没有必须写,就是你只要确保安全。但有些地方是必须让的,完全停住,有些地方没有写,你可以酌情礼让。
还有,红绿灯问题。在北京红灯可以直接掉头,比如,北京一个路口,在最左边的道出去没有写不许掉头,前面是圆的红灯,有些时候是可以直接掉头的,没有写是可以掉头的。但广州不行,所以就非常有趣。待转区也很特殊,有些地区待转区是执行绿灯亮了就进待转区,但是有些待转区不是的,左转过程中走着走着前面忽然给你停了,也很不一样。
无论是用什么方法,规则还是端到端的方法,都要去面对各种各样的规则。这也是主机厂的优势,因为我们有原生用户数据,通过用户行为来推断出对交规的理解,把它体现在我们特别敏捷、特别泛化的模型里,就像掉头这个场景,玩法就很不一样。我觉得总体而言,有一些智慧城市的交通理解会难一点,需要更多模型,这也是我们需要XBrain对场景理解的需求跟必要性所在。
对于驾驶员来讲,交规很重要,更重要的是安全,安全永远是最重要的。对安全而言,最重要的肯定是弱势交通参与者的安全,所以我觉得处理好电动车行人是最大的挑战。有一些没有专门非机动车的城市,挑战会更大。
小鹏汽车有全国的数据,XNGP从广州扎根,既有城中村小路,那里有很多小电瓶车、快递小哥、外卖员穿梭,这也是我们一开始就去挑战高难度模式的一个原因。如果说要面对全国都能开、全国都好用,这是要面临的一个挑战。
端到端只是冰山一角,更重要的是水面以下95%的部分
腾讯新闻《远光灯》:各家都在说端到端,用户体验层面能不能感知到各模型之间的不同?小鹏汽车的差异化竞争力是什么?
李力耘:我不会直接去对比我们跟友商。
从小鹏汽车自身来看,端到端给我们带来最重要的是什么?第一个是研发效率变快了。比如,原来掉头跟环岛和掉头,是以前只有在有限的几个高精地图的城市有少数的掉头,现在基本上所有城市的掉头都能去处理。因为我们拥抱了端到端这样的能力,对于看不见的地方,只是模糊知道这里有个掉头,因为你根本也看不清,掉头对你来说就看到了一个垂直的前面,啥也看不到。
从表象上来说,或者从用户跟从我们能感受到的区别来说,我们对看不见的地方有了强大的脑补或者是边走边看,像人一样很自然融为一体一边走一边看的能力。我们是极少能够全国在哪里都可以掉头的能力,在用户这儿是有体验的。
不是说基于规则,掉头和环岛不能做,基于规则这些都可以做,但是你要花大量的精力和时间。我们戏称你要先去识别场景再修路,再去做路径,再去做预测,再去做速度,这一个链条下来,原来可能要半年,现在可能一两个月。在我们看来效率的提升是很大的。
当然,这里有一个很重要的点,效率提升也是要基于内功跟中后台体系能够配套,这也是小鹏长期投入的优势跟笃定所在。因为我们常年坚定投入这一块,在数据闭环和体系上,包括整个研发的流程跟体系上都是很不一样的。
举一个有趣的例子,我觉得这也是我们能吸引人才的一个点。我们的工程师去写代码,评价代码的第一关不是各位老师,是用AI来过你的第一关,AI会给你点出这儿风格不好,这儿有重复,这儿不高效,这儿写错了,比如忘记返回了、类型不对了、Runtime(运行时)不对了,或者这儿有内存踩踏风险。
我们整个体系里面,AI不仅仅是体现在车端跟云端的能力,AI也体现在对代码工程师的赋能,所有的代码第一步先过AI老师的检查,如果不过AI老师的检查都不会进入到Tech Leader(技术负责人)或上车去集成的流程里面。AI已经深入到研发的每一个角落了。
腾讯新闻《远光灯》:用AI评价代码是从什么时候开始的?
李力耘:我们很早就开始布局了,从2022年中开始。我们拥抱AI不仅仅是车端有几个模型连起来,或者端到端,这些只是冰山下的一角,你能看到的是水面上的部分,但更重要的是水面以下95%的部分,就是整个体系得变,基于模型迭代、数据挖掘的去构建你的体系。
更重要的是,你的习惯要变,在工作中也要去拥抱AI来提高自己的效率,所以我们是全方位的。
腾讯新闻《远光灯》:水面以下95%的部分都包括哪些?小鹏之前说国内有万卡以上的公司非常稀少,具有5000 - 1万卡的公司也屈指可数。
李力耘:不能跟做通用人工智能的相比,在车企里面,我们卡应该是TOP级别的,这也是我们笃定投入的一个表现。因为你要吸引一个AI优秀工程师里,其实不光是人多就行了,他会问你有多少资源、有多少卡给他、供他使用。更重要的是围绕这些卡,我们提供的给工程师的训练服务,包括数据流转是否高效,训练基础设施是否完备,这些是我们长期持续跟笃定投入下体现的成果。
其实车上的网络或车上的东西,更加需要耐心、资源和投入。因为车端网络从终局来说,具有一些相似性,或者大逻辑是相似的,毕竟它解决的任务是一样的,但不能说完全趋同。另外,车端也只是浮在上面的部分,你怎么长期把车端进行迭代、进行升级,这反而是更重要的一部分,这个不仅包括中后台的数据飞轮跟闭环,还包括所有员工的工作方式。
腾讯新闻《远光灯》:我的理解是,验证一个系统是否好用,或者是否达到一个具体的目标值,第一是需要跟友商横向比较,这样用户层面才会有感知,第二是内部会有个系统化的验证逻辑和方法,这个你们内部怎么做?
李力耘:跟友商比只是最终的体验,但是从我们把一个软件或者任何软件改动发出去的过程中,我们会有一个完整的全链条流程。它从AI开始看你的代码开始,第一步不经过人,AI来看代码,到后面人会开始做方案评审,到后面我们会有一条完整的SiL、HiL,实车验证的全链条过程。
其中最重要的一个就是仿真,我们有时候把它叫做software-in-the-loop(软件在环测试),其实这个也是车企的一个术语,自动驾驶企业喜欢叫它simulation或者叫做仿真,这个我们做得是非常重的。我们收集了数万个Cut-In,你可以想象在云端打游戏或者是在云端重演这个平行世界,看看每个故事的结局都是什么样的。
如果这些综合的专项游戏场景打出来比你改之前的有进步的话,这关就过了。当然,这个只是以Cut-In为例。除此之外,我们有大量的数据要去云端仿真,每天大概是成千万到亿公里级别的,云端得有多大。除此之外,我们也会有hardware-in-the-loop(硬件在环测试)的路子,就是台架仿真,这个就更接近实车,但是它的世界是从以前的真实世界做一些推演的虚拟世界,方法论都类似,从闭环角度来看这些世界的演变是不是符合我们的预期。
这关过了之后,最终我们会小范围的用我们的实车产品测试,让研发亲身看看,看看自己的感受。这是一个完整的迭代链条,这个迭代链条积累到一定阶段就会打包成一个软件,交付给我们全国大规模的实车测试,最终经过内测、公测到用户的车。
腾讯新闻《远光灯》:一个大版本迭代,大概会经历多长时间的验证?
李力耘:之前我们每个月都会发一个版本,对用户而言,每个月都会收到我们正式的版本更新。但是对内部而言,基本上每周我们都可以稳定地让内部买车的同学们直接体验到最新版本,也可以提问题、反馈问题。
腾讯新闻《远光灯》:我觉得各家的产品性格其实是不一样的,小鹏在技术投入上是一个比较激进的公司,在智驾产品策略上是一个什么样的定位?比如说激进或保守?
李力耘:首先在技术上我们是以终为始的,因为相信这个方向,所以才去看见。
在产品上,我们的笃定和坚持是以我们推的软件给用户的体验一定是不断提升的,我觉得目前还很难直接定义风格,但是我能确保我们的每一款软件,如果真的要定义成渐进,我们的体验一定是渐进往上的,这是一个单调递增的曲线,我们绝对能保证它不会下降,这是我们对用户的承诺和一个坚守。
“什么都没有就做大模型,那你就没有下限了”
腾讯新闻《远光灯》:你怎么看大模型上车这个说法?
李力耘:我觉得对车企来说,车上可能并不会弄一个全知全能的大模型,比如可能是回答“你是谁,你从哪里来”这样的大模型。我觉得这要看应用方向,你要做驾驶还是要做语言问答,还是要做包罗万象?语言模型参数都是几百B(Billion)的,我们车端的自动驾驶模型几十B这个量级已经是一个很不错的情况了。
腾讯新闻《远光灯》:在端到端潮流中,前期没有中后端布局的企业能弯道超车吗?你们怎么打造自己的护城河?
李力耘:如刚才所说,车端不能说完全趋同,但它有一些相似性,因为它解决的任务是一样的。
我们和小鹏的思考是,最终能够有智驾能力的车企应该很多,但可能大部分都是六七十分的样子,真正做到八九十分以上的,我们相信一定是非常笃定的、自研的、有很强中后台能力的,真正面向AI化改革的车企。
我们相信可能全球范围内只有几家,而小鹏会是其中的一家。
腾讯新闻《远光灯》:你是说全球范围之内吗?
李力耘:对,全球范围的车企。第一,我们认为,无论你是从规则进化到模型,还是原来什么都没有直接去搞模型,车端只是一部分,更重要的那90%是围绕车端为它服务的数据闭环部分,包括数据的获取、收集,去清洗、标注、存储,以及训练框架的有效性。比如,一个训练集群的利用率是10%和90%也是不一样的,举个例子,大家都是一千张卡,你的卡的利用率是10%,我的利用率是60%,这就不一样。有足够多的优质数据喂给模型进行训练同样重要,目前我们的模型训练数据量已经达到2000万clips(视频片段)。
第二点,还有我们工程师思维方法,他们去解决问题的方式也要变成数据驱动型,所以从护城河而言,笃定的投入和人才是最重要的,除此之外,整个中后台体系和数据体系也要面向AI化做变革。
第三点,不是说我拥抱AI,扔掉所有负担,我就AI了。其实AI化是一个很漫长的过程,它是一套工作方法和工作机制和一套理念和你的行为,甚至对你的组织架构改变渗透的过程。我们认为,这个过程甚至是以年计的。所以,当AI没有做好,不能解决你问题的时候,你原来的基础还在不在?你原来的那套能力能不能帮你兜住一个70分的底,甚至一个80分的底?我觉得这个也很重要。所以,我觉得既需要积累,也需要变革。
腾讯新闻《远光灯》:它是一个渐进的、互相融合的过程?
李力耘:对,所以你什么都没有就做大模型,那你就没有下限了。某种程度上,AI能够带来你的平均能力的快速提升以及天花板的大幅提升,但是,底线怎么办?它没覆盖的地方怎么办?还是需要以前的积累能够顶上。
腾讯新闻《远光灯》:这个长期投入的过程需要持续多久,才能达到行业平均值?比如小鹏汽车一直在保持投入,现在已经10年了,我相信前5年肯定没有后5年投入更多,这种投入什么时候能趋于稳定?
李力耘:我们会笃定投入,但是投入肯定不是无限制增长。智能驾驶经过这么多的兜兜转转,包括从规则到AI化,从有图到无图,包括各种各样争论中,Robotaxi还是量产辅助驾驶等等,在我看来,辅助驾驶到今天已经走向最后冲刺的时候了,所以我觉得基本上有两个重要的点:
一、据我判断,在车端,今年年底或明年年初会触达更广泛的用户,AI的渗透率比现在会更高,这是我们希望看到的第一个变化的时刻。
二、更重要的是,明年年中以后,会看到无论从产品品质到迭代、进化的方式都会在AI驱动下呈现出不一样的速度和加速度,会越来越快,我们今天是逐渐在打通的这么一个阶段。
腾讯新闻《远光灯》:现在已经有人提出了one model,你们怎么看?
李力耘:端到端的本质是一种极致的模仿学习,需要数据没有损耗的极致利用。为了实现这个目标,我们的基本策略是:模型精简,打通数据通路,建立更强大的 AI 架构。端到端的目标不是端到端,而是为了有效利用数据。它的背后是极致和严格的工程能力,要以强大的基础设施作为地基,让数据流转起来。所以端到端只是开始,不是终局。
我们将感知、规划、控制三大模块的关系从上下游串联变为深度融合,让数据在一体式模型里自由高效地流通,从而能够实现从输入(场景画面)到输出(车辆动作)的学习和生成,实现类似人类经验直觉的驾驶。
腾讯新闻《远光灯》:端到端时代,你怎么看纯视觉和激光雷达路线之争?
李力耘:我觉得端到端淡化了硬件区域,核心是网络,你是用摄像头还是激光雷达还是毫米波雷达,可能不是那么至关重要的,就会淡化这个差别。
腾讯新闻《远光灯》:有观点说,端到端落地趋于成熟的那天,也是行业两极分化的那天。解决方案商只能做低级别的、成本较低的辅助驾驶,头部主机厂会主导更高级别的自动驾驶的量产落地。你怎么看?
李力耘:我们相信端到端会带我们实现L4的无人驾驶,但成本高低描述的应该是随着端到端的发展,单车硬件成本会降低,但对于整个大模型部署、算力的需求、数据量的需求是巨大的。
小鹏多年来坚定地投入AI,无论是模型的先进性、数据的流通性、算力的投入,都处于行业领先水平。AI体系能力是让数据飞轮高效运转的关键,当前我们的端到端可以实现平均每2天就迭代1次,未来会越来越快。我们的目标是2026年通过软硬件升级实现L4无人驾驶能力。