贾浩楠 发自 副驾寺
智能车参考 | 公众号 AI4Auto
“奥本海默的第一颗原子弹威力大小不重要,重要的是把原子弹造出来,证明这件事情是对的”——
地平线副总裁&首席架构师苏箐——官方对他的介绍已经是“HSD缔造者”——是这样评价“原装正版”的。
苏箐承认自己一度对自动驾驶绝望,直到FSD V12横空出世。
至于那些不好意思说自己尾随特斯拉的玩家,苏箐直接“替”他们坦白:
FSD V12率先证明新范式的可行性,不敢投入成本验证的玩家,现在都在跟进。
但对于新范式普及全行业“嗨爆”,苏箐又反常识地泼了一盆冷水:
深度学习范式已经见顶,未来3-5年只能做一些优化工作……
地平线HSD在公布后极短时间内拿下大量车型定点和实际交付装机数额,成为行业今年最意外的“黑马”。
背后核心负责人推动者苏箐,职业生涯一直以洞若观火、心直口快闻名,每次对外输出都能引起自动驾驶、智能汽车行业震动。
刚刚的地平线生态大会主场,苏箐从离开华为时的行业背景讲起,谈及特斯拉的石破天惊、HSD的启发、传统L4几乎注定的命运终结、深度学习范式的局限……
既是自动驾驶的发展史,也是了解当下AI大模型浪潮底层逻辑、后续发展最直接的窗口。
(以下苏箐演讲实录,只做流畅性编辑,文中“我”代表苏箐)
行业之艰:“一开始根本不想再做自动驾驶”
行业外来看,可能觉得自动驾驶是一个很简单的事情,因为任何一个人有一两年驾龄开车,那么他就会开得挺好。
但是对计算机来说不是这样的,跟人的能力是反过来的:越是人觉得难的问题,计算机可能越简单,比方高等数学,比方逻辑分析;但是越是人与生俱来的基本技能,计算机越难。
干自动驾驶这么多年,体会极深:它是智力、体力、肉体的多重压榨,极度痛苦。既有方法论的变化不确定型,又会碰到各种hard case、corner case,并且物理世界的AI是没有资格去选择ODD的,所有的case都要能处理。
我刚准备加入地平线的时候,跟余凯博士聊过几次,当时跟他很坚决地表示,我不想再做自动驾驶了,第一太痛苦,第二我感觉看不到太多的希望。
因为在那个时代自动驾驶确实都能开,但它离一个真正的人类司机差距是非常大的,很多case处理不了,本质是一个应激反应的机器。
23、24年的时候,整个行业多多少少都会有这种认知:可用,但不好用,而且看不到太多希望。
范式之光:FSD V12是“行业核弹”
2024年的时候分水岭事件出现,就是FSD的V12,非常非常关键。现在业内总在吵FSD到底是不是最强,其实这个问题不重要,核心是FSD打开了一个内核的范式。
举个例子,德国科学家率先发现核裂变是可能的,而且能释放大量能量。后续量子物理学家们又花了N年时间实验复现证明这个理论是对的,又过了N年美国才造出了第一颗原子弹。
对应到深度学习,就像当初的核裂变实验一样,他告诉你这个范式是可能的,但在什么时候,以什么形式把自动驾驶做到什么程度,其实在第一个人做到之前,没有人知道。
FSD V12是第一个让大家看到这个希望的。
所以我们不需要去讨论奥本海默造的第一颗原子弹的威力大还是小,这件事情不重要,重要的是他把原子弹造出来,证明这件事情是对的。
回顾自动驾驶历史,从DARPA的CMU的车队最早强依赖非视觉传感器,比如激光雷达,因为那个时代还没有所谓的机器学习的技术,纯靠人工写代码写出来的。
第二代斯坦福的车队引入了机器学习的技术,很快超越CMU,这是第一次技术范式变化,后续落地发扬光大的其实就是Waymo。
但仍然有两个问题,首先深度学习技术只重构了感知部分,而在感知之后的部分几乎还是规则的,那么它就只是革命革到一半的东西。第二点只解决了动态的问题,没有解决静态认知的问题,所以或多或少需要用地图。
谈论一个方法论重构行业,不可能只有一半,需要把后面的那一半的革命完成,才能迎来新的时代——这就是端到端的意义所在。
但这件事情非常难。首先感知技术其实也是发展了很多年才完全实现数据驱动;其次规控理论至今仍然不成熟。
基础模型Train一轮至少需要花几亿,甚至10个亿、20个亿。Train出来还有可能fail掉,因为整个系统非常不收敛,任何一个噪声都会导致整个系统fail。
这个时候你还敢不敢接着train?大多数团队或出于钱或出于认知,都不坚持了。
这其实就是FSD对于整个自动驾驶、AI范式改变的巨大意义。
产业之变:L2与L4统一重塑
FSD、HSD出现,终于又看到希望了:终于能用新技术把城市级别的L2做到好用、类人。
今天大家看到的HSD其实还只是新范式的第一个版本,未来一年会有巨大的提升,因为新范式打通以后它有一个红利期。
红利期的意思就是从数十万的车到20万的车再到10万的车,L2+就像自动挡一样,全部标配且好用。这本身也是计算机工业的优势:突破成本极其高,但复制成本极其低。
对于广义自动驾驶来说,过去因为范式的问题,L2跟L4是两个完全不一样的世界,虽然都是做自动驾驶的,其实是两拨人——L4比如Waymo,为了达成超低MPI实现真无人,需要做很多额外的工作,比方说上超豪华的传感器,比方说高精地图,再比如需要把ODD画得比较小,使hard case、 corner case可控…….要做很多很多非本质事情,然后才能把L4系统部署上去。
通过这种方法把自动驾驶技术卖给所有人,显然是不work的,对吧?
甚至现在的Robotaxi就能work吗?其实也不。说实话,所有人知道这件事情是有问题的。
但是新的范式到来以后,能看到方法论终于统一了。当前方法论最多两到三年的工作,就有极大的机会把MPI干到5万、10万公里的水平,同时它还能保持类人驾驶风格。
同时它还能保持在所有区域里面自动可泛化。
我一直不同意一个观点,就是为啥Robotaxi只能是Robotaxi?我就想买一辆L4的车,为什么不行?
新方法论改变了这一点,未来的短短的几年以内,用同样的开发范式,不但在L2上能带来新体验,同时还能带来一个全新的L4系统:以极低的部署成本和几乎无限制的速度扩张——
自动驾驶以乘用车和Robotaxi的双模式去部署。
一个生动的比喻,2024年之前,这个行业的想法是这棵树已经种不下去了,就长这么高了,有其他的需求就再种其他的树。
2024年之后方法不同了,我们就种这一棵树,但是把这棵树种的越来越粗、越来越高——对应数据量越来越大,然后你会很欣喜地发现它“长”出了新的能力。
比如HSD开发过程中,在团队完全没有人为设计、干预的情况下,系统自己掌握了“靠边停车”的能力。
这就是新方法论和数据驱动的魅力:从人类的稠密数据里面它会学习能力,不论是好的还是坏的。我们要做的是把坏数据、行为处理掉。
过去的方法论可以认为是加法,是人工把一项一项的能力点往上加,而新的方法论某个角度来讲是减法,把不想要的东西剪掉,而剩下的就是全栈能力。
这会导致自动驾驶行业出现两种完全不同的产品思路或阵营。
一种是过去那样继续拼各种新功能,一种是像HSD和FSD这样把这棵树种得越来越大。
我们绝不去做一些零碎的功能,而是要让这些功能在这棵树上自己长出来。如果今天还没到那个时间,就选择不做它,这是我们的态度。
未来之辨:“深度学习已见顶,3-5年内只能做优化”
FSD的范式变化意味着什么?
大家最近都很嗨,因为一段式搞定了,各种乱七八糟的概念也都跑出来了,所以以后会进入一个大发展时代?
坦白说我要浇一点冷水。
人类是很奇怪的一种动物,事件不发生的时候是完全不相信这件事情会发生,但是在一个事情发生以后,人类会觉得这件事情会持续发生,两种认知其实都不对。
大多数时候一件事第一次发生的时候,很可能就是这个时代的最高点。不要以为革命是一波一波的,第一波很有可能就是最后一波。
对人类来说的话,只有两件事情是重要的,一个是能源,一个是信息,当然信息可以直接叫计算。这是两个改变世界和创造世界本质的东西,其他的事情都是在这个基础上递增出来的附属产物。
原子时代核心是能源,而人工智能或者AGI时代fundamental的东西就是信息。
所谓自动驾驶、AI重构范式大概率不会是常态。
首先是人工智能本身的周期律,每二三十年干出一个新范式来,然后把它兑现掉,但同时发现还是有天花板,下一个突破可能就是20年以后。
目前,隐隐约约能看到这一代的深度学习技术,有一点碰到天花板的趋势,不能说一定,但是有这种可能性。
第二个,如果之前自动驾驶革命只进行一半的话,现在是真革完了,就是一段式端到端完成的。
那么如果我们希望再有巨大的飞跃,那就要改变内核的理论了,也就是对深度学习的彻底推倒重构。
很不幸的是,现在还没有看到下一个理论突破的前置信号出现,可能还需要5年、10年甚至20年才能突破。
所以我(即苏箐)个人的判断:
大概率未来3年是在现有的系统上做极致优化,而不是理论内核的重构。
所以大家别太嗨,又要进入苦日子的阶段了。
前行之基:范式大一统,自动驾驶公司还能竞争什么?
回到刚才那个基本假设:AI和AGI的基础理论在未来三到五年可能不会有全新的突破。
这个大前提下,还是有几件事情是可以做的。首先,大语言模型感觉碰到Scaling Law的天花板,但很高兴的是这件事在自动驾驶领域还完全没有发生——成本、功耗、芯片工艺等等都没到天花板。
地平线之后会坚持每一代芯片10倍算力、10倍模型容量提升。
大家一定要记得一点,就是计算机工业的本质就是玩命堆算力。千万不要问它有没有用,因为算力就是计算机工业里面最fundamental的基因和逻辑,任何违背的人都被历史淘汰了。
第二件能做的事情,就是重投入L4,但不是以割裂的形式去做,而是以统一的开发范式、统一的传感器配置、统一的ODD区域打通L2到L4。
第三点,行业和技术千变万化,应对这件事情的时候,第一不要应激,不要每隔几个月就怀疑以前都不对,要全改。
有新技术的时候能快速的去导入它,碰到问题爆发,有集团军的作战能力去把它消灭掉——好的工程能力和好的组织能力是公司至关重要的,我称之为工业母机。
所以需要做的事情是把团队的工程能力和组织能力不断强化、强化、再强化,只有一个稳定承载工程的公司组织,才能应对一切变化。