头图来源 | 商汤官方
作者 | 伍文靓
编辑 | 苏鹏
在汽车智驾供应商站在舞台中央、高调营销智驾第一梯队的概念时,商汤绝影这两天开了一场发布会,让人开始重新思考供应商以及车企之间的关系。
诚然自己的技术产品十分重要,但商汤把「绝影实力AI DAY」演讲环节三分之二的时间留给了合作伙伴——奇瑞大卓智能以及联发科技。
在合作伙伴的见证下,商汤绝影CEO王晓刚正式发布了AI汽车创新产品「A New Member For U」(你的家庭新成员),能够综合理解文本、图像、音视频、3D等信息模态,包括人的表情、语气等。
关于时下最热门的「端到端」话题,王晓刚向大家介绍,商汤绝影正在基于地平线征程6系列芯片和英伟达芯片打造智驾量产方案,最快明年Q2量产落地。
可以预见,在即将到来的2025年,智能汽车玩家们关于端到端智驾方案的竞争将会异常激烈。
王晓刚认为,「地大华魔」会有先发优势,但未来端到端的关键竞争点不在芯片、算法,而在于数据,“谁离数据最近,谁的数据基础设施最强,谁才有主动权。”
同时他还对当下供应商和车企之间的生态进行了点评,“当下汽车行业发展模式不可持续,希望市场回到正轨。”
作为商汤绝影的重视生态以及合作伙伴的一部分,在王晓刚演讲之后,奇瑞大卓智能CEO谷俊丽以及联发科技副总经理张豫台也登台发表演讲,分享了他们对智能汽车进入AGI时代的思考。
明年量产智驾方案上车
随着智能汽车的普及程度越来越高,车舱智能助手则承接「使用说明书」这一角色。
尤其是大模型上车伊始,智能汽车的功能数量及精细程度急速上升,车舱智能助手则可以为用户提供基础的信息查询和问题解答服务。
尽管目前市面上的汽车AI Agent具备逻辑思考和通用任务处理能力,并且能够根据用户的指令,完成复杂的连续性任务,但它依旧局限于被动服务。
商汤绝影期待AI汽车的智能座舱不再只是个听话的工具,而是能够主动学习——在知情允许之下,座舱能记住用车人的偏好,比如喜欢的温度、常去的目的地以及更多个性化细节。为此,商汤绝影打造了「A New Member For U」(你的家庭新成员)。
在高阶智驾方面,商汤绝影的AI DAY上基于地平线征程 6 系列芯片和英伟达芯片打造了量产方案:
AD Pro:基于征程6E(J6E)芯片,算力80TOPS。感知系统7个摄像头和多个雷达。基于地图以及类似记忆领航的方式打造的极具性价比的产品。
AD Max:基于征程6M芯片算力(J6M),128TOPS。感知系统11摄像头和多个雷达,进一步降低对于地图的要求,甚至做到城区无图NOP。
AD Ultra:基于英伟达Orin/Thor芯片打造的端到端方案,算力超过200TOPS。感知系统包括11摄像头和多个雷达(支持激光雷达扩展应用来进一步的提升能力上限),达到点到点领航以及接近L3的智驾能力。
其中,前两个版本将会在2025年Q2进行量产,已经与大卓智能、东风汽车等达成战略合作。而AD Ultra版本将于2025年Q4进行量产。
对于现阶段的商汤绝影来说,找到项目重心是非常重要的,“前阵子我们的组织架构和智驾战略有调整,是因为之前的项目相对来说分散一下,我们之后会更聚焦,比如明确了J6E和J6M平台、端到端量产自动驾驶等。”
作为出席本次发布会为商汤绝影站台的嘉宾,大卓智能CEO谷俊丽也一道分享了他们在智驾方案的进展和规划。
为了服务奇瑞汽车在全球的业务,大卓智能目前已搭建了1000人的多元化团队,全球7地协同工作,Pliot(L2、L2+、L2++)和Drive(Robotaxi、Robobus)两条产品线并进。
其中在量产智驾方面,今明两年,国内全品牌——奇瑞、星途、捷途、iCar——会搭载高速NOA以及城市记忆行车,2026-2027年搭载无图端到端城市NOA,2027年之后做到L3/L4规模量产。
随着奇瑞汽车的出海,大卓智能也在计划智驾出海的事宜,目前已经在沙特测试了无图高速NOA,很快就会在海外多地进行推广。2026-2027的目标是在海外落地高性能高速NOA。
大卓智能目前正在推进的城市NOA技术框架为:感知模型、预测决策模型,基于规则的规划和控制、基于轻图和感知的实时定位。“明年将进入两段式向一段式的端到端方案过渡。”谷俊丽表示。
可以很明显感知到,对于车企以及智驾玩家来说,明年将是非常关键且竞争激烈的一年。
端到端之争,核心在数据
无论是上文提到的基于AI驱动的智能座舱助手,还是端到端量产智驾能力,都离不开大模型的支持。以商汤本次发布的产品为例:
智能车舱助手方面。
「家庭新成员」基于商汤绝影原生流式多模态大模型,能够综合理解文本、图像、音视频、3D等信息模态,包括人的表情、语气等。以前是视频的信号和语音信号分开处理,最后做一个简单的链接。
此外,商汤绝影还针对车载场景进行定制,融合感知数据针对性训练。
高阶智驾方面。
UniAD端到端智驾方案得益于商汤绝影「开悟」世界模型,能够生成人车混行、环岛路口等复杂城市场景,甚至可以复刻“8D”城市构造,从而大幅提升自动驾驶系统的训练效率和适用场景范围。
「开悟」世界模型还可以生成时间最长为150秒、分辨率可达1080P、视角实现11V的场景视频。
实际上,相比起市面上的部分友商,商汤绝影在端到端智驾方面的进展并不算激进。因为王晓刚认为,颇受关注度的大疆、华为、Momenta一定是有先发优势的,包括算法、芯片、垂直整合方面的能力,但智驾高端局的竞争不止是车端模型的比拼,端到端的决战战场在于云端、在于数据。
上文提到的智能车舱助手「家庭新成员」,就是商汤基于车端与云端结合打造而成。在云端能力的加持下,人机交互发生了全新的改变。
这一点在商汤绝影的宣传片也有所展示,当驾驶员对车舱助手说“请将车辆停在路边这位打着绿色雨伞的女士旁边”之后,车机系统迅速理解并果断执行了这一指令。这在以前是很难想象的。
同时,过去一年多大模型的飞速发展,基本上已经将互联网上的公开数据榨干。那么,未来大模型训练的数据从哪里来?
王晓刚认为,新数据的主要来源之一就是垂直行业。比如说在自动驾驶场景下采集的各种数据,在复杂情况下自车行为发生变化的时候,这些数据是非常有价值的。
在大模型爆发之前,小模型只能解决特定的任务,包括自动驾驶的特定场景。商汤到2021年年底已经拥有超过2万个商业化小模型,针对不同客户、不同场景做了各种定制化,积累了海量数据。
未来,只有在垂直领域更加深入地挖掘才能有新的数据、实现新的突破。王晓刚说道,“过去自动驾驶交付模式还是偏标准化。未来,谁离数据最近,谁的数据基础设施最强,谁才有主动权。”
除了数据挖掘和处理,跟客户进行数据标准和架构对齐也非常必要。这是因为随着长期发展,大模型接入的项目以及所涉及到的车型会越来越多,如果数据标准未对齐,将会产生大量重复性工作,项目的效率也会变差。
目前,大卓智能也非常重视数据中心的建设——星海大数据平台。根据谷俊丽的介绍,这将是一个通用化、智能化、多模态的承载百万量级的量产数据云。
按照规划,星海大数据平台会设立6个数据中心、赋能奇瑞旗下30+车型及280多万辆车、达到300PB+数据规模。
推动市场可持续发展
今天的汽车行业,处在通用人工智能发展的一个拐点。供应商与车企、合作伙伴之间的协同方式也随之变化。
在传统的汽车产业分工之中,Tier 1 整体上更偏负责黑盒交付、模块化集成,未来这种方式将不复存在,产业协调以数据驱动为导向。
而且对产业分工,不少人原来的刻板印象是,项目少、车型少,大家必须你死我活。但在新时代,发展势头较好的车企都有大量的量产交付车型,需要足够多的交付资源以及更好的交付效率。
尤其是像奇瑞这样的主机厂,旗下品牌多、产品系列多、量产车的数据非常之庞大。如果有一个角色能够在数据、工具链、算法架构上帮助主机厂及自研团队多做一点事情,客户就能在这部分少费一点心力,提升交付效率。
“如果大家是恶性竞争和互相取代的关系,那这个行业模式就是不可持续发展的,基础设施的建设成本也是难以承受的。”王晓刚认为,当代智能驾驶的研发投入之所以居高不下,其中涉及到很多重复性的工作。
同时他也解释了,在新时代下,商汤绝影将如何赋能车企的发展,“比如跟主机厂自研团队的协同,我们能够提供基础算力和数据平台化能力,能够齐数据生产的标准和算法的架构。”
王晓刚将车企所拥有的海量数据比作地底下的“石油”,而商汤绝影所做的事情则是为车企提供坚实的数据生产管线,便于车企从“油田”中开采高质量的数据,反哺车企产品迭代。
目前,商汤在大模型以及数据基础设施方面的投入已经超过百亿,后续还将继续加大这方面的投入。
对于商汤绝影而言,他们正在努力尝试,通过这一波AI浪潮找到自己在汽车市场中独特价值和生态位。