解读小鹏G7:算力2200TOPS,意味着什么?

图片

全球算力最大的汽车来了,小鹏G7。

全车搭载三颗自研的图灵芯片,总算力超过2200TOPS;支持L3级算力;能本地部署VLA+VLM双大模型;能部署VLA-OL模型;有座舱AI操作系等等…

图片

单看发布会上,信息量很大,甚至有点眼花缭乱,难以把握重点。但万变不离其宗,要我来点评G7这台车,就一句话:

这是全球首台第二代智能汽车(即AI汽车),在硬件和软件层面,全部为拥抱AI和大模型而来。

2012年,特斯拉造出了第一代智能汽车,从此掀起了全球汽车行业的变革浪潮。十多年过去了,AI大模型的出现,让智能汽车迎来二次进化的新机遇。

小鹏G7,就是登上第二代智能汽车舞台的第一个玩家。

一、大模型呼吁第二代智能汽车

2000年左右,汽车开始了数字化进程,舱内增加了屏幕和操作系统,L0/L1级的ADAS系统开始出现,这是智能汽车的前身,数字化汽车。

到了2012年,特斯拉Model S出现,将车内几乎所有功能都整合进中控大屏,不仅可以实现功能联动,并且还具备OTA升级的能力。

同时,特斯拉基于AI技术开发了AutoPilot、NOA领航辅助等智驾系统,从本质上带动了ADAS功能的升级。

至此,汽车正式从数字化迈入了智能化。特斯拉定义了第一代智能汽车,还顺手点燃了中国乃至全球的智能汽车浪潮。

图片

随后10年里,大家基本都是沿着特斯拉开创的道路前进,不断优化迭代。

时间到了2022年,ChatGPT轰动世界,大模型成为科技之光、最先进的生产力。技术敏感的几家车企,迅速行动,将大模型技术应用在智驾和智舱领域,由此将第一代智能汽车推向巅峰。

虽然功能上是当前的巅峰了,但此时使用AI技术的方式还比较初级。

一方面,目前车载芯片算力较小,难以支撑大型VLA模型的量产部署,智驾依然停留在L2级的阶段。

另一方面,智舱虽然接入了云端AI大模型,但AI只是作为一个应用而存在,主要是与用户进行聊天,还没有达到AI Agent可以任意调用其它程序和车辆功能的阶段。

作为少数几个能看懂,并且坚定要All in AI的车企,小鹏当然看到了上面的问题,因此也在积极推动旗下车型从“少量应用AI”向着“深度部署AI”转变。

图片

这也就是说要打造第二代智能汽车(即AI汽车)——在智驾上为现L3做准备,在智舱上,为部署AI Agent做准备。

而第三代智能汽车就是智能汽车的终局,即汽车机器人了。

一套AI系统,或者说一个AI模型掌管全车,用户上车后,直接告诉AI你要去哪,它以无人驾驶的方式开过去。

路上听歌/娱乐/办公/通信等所有需求,只要说一声,AI就会全部帮你执行,就类似钢铁侠的AI助手贾维斯。现在我们熟悉的内饰布局、系统UI等方式都会完全重构。

当然第三代还很远,本文我们只在第二代智能汽车的范畴里讨论。

二、2200TOPS:为大模型而来

对于第二代智能汽车来说,要在智舱和智驾领域深度融合AI技术,一个基本前提是要能够本地部署大模型。

为啥必须本地部署?

首先,智驾系统负责开车,与安全息息相关,需要迅速反应,联网处理数据再回传结果,时延和波动无法接受。所以智驾系统从诞生之日起,都是本地部署模型,主要的发展方向是想办法部署更大、更强的模型。

其次,智舱部分想要提升AI体验到一个新高度,从“安装一个AI应用”升级到“AI Agent”,甚至是“AI OS”的阶段,也必须本地部署,只有这样才能让AI在系统层面,任意调用车内的其它程序,以及可以实时控制空调、座椅、车灯等车辆硬件。

另外,目前AI领域Scaling Law依然存在。所以通过使用更多数据训练模型,提升模型的参数等手段,依然可以明显提升模型的性能。

所以对于第二代智能汽车来说,在成本范围内,要尽可能提供最大的算力,以支持本地部署更大的AI模型。

所以小鹏才会在G7这台车里塞进去了3颗自研的AI图灵芯片,其中两颗服务智驾,1颗服务智舱(智舱还有一颗高通8295),全车AI算力总计超过2200TOPS。

图片

本地部署大模型对内存容量和带宽的要求同样很高。

小鹏给智驾和智舱控制器总计提供了216G的内存。官方没有透露具体的规格,但是我个人分析认为,两颗智驾芯片总计配备了128G的内存,座舱图灵有64G的内存,高通8295有24G的内容。

从内存容量来说,智舱和智驾控制器里,加载一个INT8精度的30B的大模型是绰绰有余。

官方同样没有透露内存带宽,但考虑到竞品芯片普遍使用LPDDR5X的内存,个人感觉其带宽应该在200~300 GB/S之间,不过这些都是推测,具体还得看官方公布的信息。

总得来看,G7超过2200TOPS的AI算力和总计216G的大内存,显然已经为智驾和智舱两个域本地部署大模型都做好了准备,并且还为未来3~5年留出了一定的算力冗余。

三、第二代智能汽车有哪些功能?

堆算力和内存,只是第二代智能汽车的硬件基础。事实上包括特斯拉在内的多个车企,都在规划搭载更大算力的新车型,是行业发展的必然趋势。

对于小鹏来说,真能拉开差距的地方,是大模型的研发和部署能力。

何小鹏在现场讲到,G7能同时部署VLA+VLM两种模型,并且VLA模型还是经过强化学习赋能的VLA-OL模型。

图片

虽然VLA是各家都在讲的一个方向,但是想要研发VLA,必须得先把上一代的端到端模型玩明白。

端到端模型是建立图像与动作(轨迹)的映射关系。训练VLA模型,一般都是在端到端模型的基础上增加了一种新的模态(语言),然后最终建立三者之间的映射关系。

一个车企如果端到端还没玩明白,甚至时序图像如何作为输入、轨迹如何编码成输出等基础原理都没弄懂,是没法开发VLA模型的,更别提VLA-OL模型了。

而小鹏在智驾领域,一直处于头部位置。2021年在国内第一个搞出了高速领航功能,2022年推出了城市领航功能,2024年7月又向用户推出了端到端智驾算法…

站在端到端的基础上,小鹏才能在今天推出VLA-OL模型。

图片

VLA-OL模型强在哪里?对于普通的VLA模型来说,主要是基于海量的人类驾驶数据,学会了“开车”。但是这阶段主要是模仿人,如果遇到特别奇葩的长尾场景,还是处理不好。

这时候就需要强化学习了。就是让VLA模型在虚拟环境中不断练习,输出好的驾驶决策就奖励它,反之则惩罚,以此逼着模型自己不断调整参数,从而实现更好的决策效果。

按着何小鹏的说法,有了VLA-OL模型,智驾的能力上限比传统模型能提升10~100倍。

对用户来说,除了能感受到智驾更丝滑,更智驾,还会发现智驾的接管次数变少了,比如从此前100公里接管10次,变成500甚至1000公里接管10次,逐步逼近乃至实现L3级自动驾驶。

VLM模型方面,何小鹏在现场并没有多讲。

根据我的分析,这个模型会部署在座舱的那个图灵芯片上,主要服务座舱的人车交互,同时也会感知车外的环境,在复杂或者其它场景,低频为VLA-OL模型提供一些驾驶指导。

如前文所言,第二代智能汽车在智舱领域的最大变化,是部署AI Agent——就是苹果Apple Intelligence在做的事情。

这个Agent会融合在车机系统层面,可以调用所有的车载APP,比如音乐、导航、美团,也可以控制所有的车辆功能,比如空调、座椅、灯光、香氛等。

图片

你对用车有任何需要,直接用语音告诉AI就行了,车辆就会主动执行相关的操作——比如调用QQ音乐播放音乐,或者打开空调等。

这里有人会问,此前的语音助手,不也能语音播放音乐,打开空调吗?有啥区别?

最本质的区别在于,此前的语音助手是程序化的Agent,没有智能。你说的每一个命令,都是人工写好的程序,用户必须说特定的语句,才能执行特定的命令。

并且过去的语音助手也不具备理解能力,分析能力,没有记忆能力,也不会主动给你提供建议。

基于大模型的Agent是真正的智能体,它能听懂你说的各种意思(就跟ChatGPT一样),然后还知道怎么操作车辆里面的各种APP和各种功能。

举个例子。比如你开车去某个酒店开会。路上接到一个电话跟客户吵架了,然后心情很糟。

你可以直接跟车载的AI说,我心情不好,不想去这个会议了,咱们直接回家。

那么Agent此时就知道“不去这个会议”就是要取消导航,然后新设置成导航到家里。同时它听说你心情不好,就会主动问你,是否需要播放你喜欢的某首音乐,调整空调温度,甚至还会问你是否要给老婆发信息,告诉她今晚回家吃饭。

因为有记忆,所以它了解你,知道你的日程安排和基本信息,然后你和它说完不去开会了,它就能帮你改变导航,改变车辆设置,甚至是主动帮你联系家人等等。

图片

那这个时候,车辆就可以变成一个具备思考和情感的智能伙伴了,而不是一个执行被动执行命令的机器。这就是AI Agent的魅力,也是第二代智能汽车的一个核心特征。

结语:AI汽车时代,小鹏率先起跑

从2200TOPS的超大算力、216G超大内存,到VLA+VLM的本地部署,再到VLA-OL模型带来的智驾能力提升和AI Agent的情感交互,小鹏G7已经构建起一台“第二代智能汽车”的全部基础。

它不仅是一次简单的硬件堆料,更是一种面向AI汽车的系统性重构。

从G7发布开始,关于“AI汽车”的新竞赛已然开始。车企间不再是概念之争,而是真正的量产车型之战。

G7,就是小鹏在AI汽车时代打出的第一张王牌。

~ok。这就是本文的全部内容了,如果你对小鹏G7有更多观点和看法,欢迎加微信探讨交流。