撰文 | 张祥威 编辑|马青竹
6月中,在一场沙龙上,地平线创始人余凯被问及L3落地时间点。
他回复,“对用户有价值、有体感的L3,可能也就2-3年之内,产品就会出来。”
卓驭科技CEO沈劭劼同样认为,两三年内L3有望落地。
但更早前,余凯在2023年曾预测,“十年以后连L3都不会真正实现”。
沈劭劼则说,“如果这个问题您在一年之前问我,根本没办法给出时间。但是最近这一年,非常酷炫的技术,成功把接管率以10倍往下降,包括基于(深度)学习的端到端,基于正向学习进行后训练,以及VLA场景理解,这些技术让我们看到了希望。”
同月,小鹏G7全球首秀,号称“全球首款L3级算力AI汽车”,该车搭载的智驾芯片方案,耐人寻味。
三颗自研图灵AI芯片,两颗芯片用于智驾,一颗用于座舱大模型。
官方数据显示,三颗图灵AI芯片有效算力2200TOPS,单颗算力700+TOPS。两颗用于智驾,也就是1400+TOPS。
同样走大算力路线的还有:极氪千里浩瀚智驾H9方案,采用两颗英伟达Thor-U芯片,算力1400TOPS。蔚来ET9搭载了两颗自研神玑NX9031芯片,算力2000TOPS。
也有没这么激进的。
理想智能焕新版车型的AD MAX版方案,搭载单颗Thor-U,算力700TOPS。《出行百人会/AutocarMax》从另一本土智驾供应商处获悉,其为车企的顶配版车型准备的新一代方案,将基于单Thor-U研发。
这就留下了探讨空间。
当下的顶配智驾方案,单颗700TOPS算力的芯片是否足够?以小鹏为代表的两颗芯片方案,要做什么?又会面临哪些挑战?更堆算力的三芯片,真的有必要吗?
700TOPS,难治算力焦虑
Thor-U量产上车前,两颗英伟达Orin-X成为行业主流高配算力方案,号称算力共508TOPS。
智驾算力是否真等于两颗芯片加总,暂且不谈。名义上,基于两颗Orin-X,多家做到了基于无图的城市领航功能。
也有供应商称,基于单颗Orin-X实现了无图城市领航。
实际上,Orin-X并非天生支持Tranformer大模型,而且,端到端模型主要运行在单颗芯片上。
以理想为例,一颗芯片跑端到端,另一颗跑VLM模型。如果深究,比单颗Orin-X算力更小的方案,号称端到端也没问题。
因为,单颗英伟达Orin-X 理论参数规模是10亿级别。不考虑内存宽带限制和算力利用率,将参数规模蒸馏到这一程度,理论上就能把端到端做上车。
更多的算力,可以做长时序推理,决策会更优秀。这与小鹏提的Scaling Law法则类似,参数规模越大,模型能力越强。有追求的智驾研发者,都在等待更高算力的芯片。
基于两颗Orin-X的可开发空间,越来越少了。
现在有了700TOPS的Thor-U,自研芯片小鹏图灵AI芯片、蔚来神玑NX9031、地平线J6P,提升空间打开。
小鹏图灵AI芯片,最高可运行30B大模型参数,号称有效算力一颗顶主流芯片三颗。更大规模参数,意味着车端模型具备更多能力空间。
当然,模型参数的规模的大小与能力之间的关系,要放在同一网络结构中对比。不同的网络结构之间,模型规模大的,能力并非一定就强。比如,Deepseek对比Llama,前者参数更小,但效果却能做到更强。
一位本土智驾供应商人士告诉我们:
“分布式肯定没有单一大芯片好,单Thor-U基本能展现推理能力。Thor-U初期基本支持的就是理想3.2B这个量级的参数规模。对于VLA来说,700TOPS算力短期内够了。”
可支持参数规模更大,再加上,图灵AI芯片属于ASIC专用芯片,理论上对算法的匹配会比通用芯片更好,所以小鹏的三芯片,拿出其中一颗,用700TOPS左右的算力跑自动驾驶,本身已经足够。
但小鹏没止步于此,摆出了芯片方案的“更大阵仗”。
小鹏G7全球首秀发布会上,宣布搭载VLA和VLM模型。媒体沟通会上,何小鹏将VLA比作掌管运动的大脑和运动的小脑,而将VLM比作整车大脑,并称两个模型之间不会是一个完整的端到端的数据流。
从这一点看,小鹏的VLA和VLM模型,应该与理想之前的做法类似,一颗图灵AI芯片跑VLA,另一颗跑VLM。
何小鹏还说,“我们正在做一些非常有趣的能力,就是来提供2颗,甚至多颗算力能够合并跑一个VLA巨大模型的可能性。”
在两颗高算力芯片上跑大模型,业界也有可参考案例。
一位国内智驾供应商人士告诉我们,其为Robotaxi提供的基于两颗Thor-X的方案,“车端的模型跑在两颗Thor-X上,都运行模型,只是分不同的任务。两颗Thor-X之间是通过PCIe 5.0互联,四链的PCIe5.0,每个链传输速率32G/s。”
小鹏的两颗图灵AI芯片,最终能运行何种“模型巨物”,还要等时间最终揭晓答案。
至于为何要单独另供一颗芯片,何小鹏如此解释:
“行业L2的高阶算力基本上都是500T,现在还有700T,某种角度700T和500T是一样的,我认为要数倍算力的提高,模型才有可能数倍的提高。我们已经看到友商会放2000T甚至4000T的算力,我相信这个算力会是L3,甚至L4重要的基础起点。”
特斯拉下一代方案AI5将搭载更大规模算力芯片,此前已有传闻。一种说法是,特斯拉的下一代智驾芯片方案或将与英伟达合作。
三芯片的“阳谋”:L3,抑或降本?
两颗已显得不同,但是小鹏一下用掉3颗,也许还有别的用意。
华为打出了中国首个商用高速L3方案,小鹏为搭载芯片的车型取名——“全球首款L3级算力AI汽车”。
小鹏G6、G9经历可谓坎坷,中型和中大型SUV市场,小鹏不仅要为G7提供与市面上拉开一档的算力,甚至想为L3做好准备。
“车端搭载1颗该芯片,可代表当下的最高水平,2颗可代表未来,3颗则会带来巨大的想象空间。”何小鹏说。
上述本土智驾供应商人士称,“L3要看国家标准,也许需要加点冗余。多颗芯片,发挥类似热备份的作用。”
我们了解到,一些L4公司的方案,主要通过多颗芯片实现安全冗余。
以上述双Thor-X方案为例,客户的可选择方案通常有两种:“一种基于双Thor-X的自动驾驶域控制平台,客户放两套互相做冗余;另一种,用基于双Thor-X的自动驾驶域控平台,再加上一颗Orin-X组成冗余方案。”
三芯片,也许是何小鹏的阳谋,通过算力占据用户心智。
需要注意,三芯片上车对于整车BOM成本。
李斌曾称,蔚来自研的神玑NX9031芯片可实现单车1万元降本。蔚来搭载四颗Orin-X芯片,小鹏自研图灵AI芯片能节省多少成本,可做一参考。
本来能节省成本,如今推出“堆算力”的三芯片方案,取决于市场是否认可了。
研发芯片前,何小鹏曾问业内人士,一年卖多少台车能赚钱?对方说10万台。但是卖了10万台车后,他发现还没赚钱。后来他又问要卖多少颗芯片能赚钱,对方说100万颗。他留了心眼,现在认为最起码要卖到100万颗。
近日,接受英国《金融时报》采访时,何小鹏称正致力于将图灵AI芯片集成到大众汽车明年在中国推出的特定车型中。
他还透露,正洽谈向其他车企供应AI芯片。如能达成合作,意味着小鹏将更大规模摊平芯片成本。