放眼当下来看,毫无疑问,智能驾驶俨然已经成为了各大车企的兵家必争之地,当然这也是如今用户在选车时格外关注的部分。以理想的智驾数据为例,截至目前,理想智能驾驶总用户达到100万+,智能驾驶总里程突破26.7亿公里;导航智能驾驶NOA总里程突破14.4亿公里,NOA里程占智驾总里程的90%。而除了这一数据在持续增长外,一并增长的还包括理想汽车智能驾驶训练和理想汽车整体的算力。
然而关于智能驾驶,其实各大车企都有自己不同的研发方向,也有不同的配套软、硬件,从依靠激光雷达到视觉解决方案,可谓各有所长。但即便如此,有一个方向是大家一致认可的,那就是“车位到车位”。但这绝不是一个口号,它真正需要做到的应该是像人一样思考、像老司机一样驾驶,从而应对各种路况。
而在11月28日,理想汽车正式公布新一代智能驾驶技术架构——端到端+VLM双系统的车位到车位功能正式全量推送,这也是行业首个全量推送这一功能的车企,那么理想的这套“车位到车位”的智驾究竟强大在什么地方?接下来我们就让“理想同学”来回答!
首先是我们在众多品牌的智驾宣传中都会听到的一个词汇——“端到端”。简单来说,当我们给出一个导航指令的时候,它能实现接收信息后直接输出一条到目的地的轨迹,而这其中没有任何规则。但不同于其他厂家的分段“端到端”,理想此次的One Model可以说是真正意义上的“端到端”,因此它也带来了三大优势。第一点是高效的信息传递,以理想之前使用的这套无图NOA为例,它由感知和规划两个模型构成,因此在信息传递过程中,需要运用大量规则。而“端到端”的出现,则很好的打破了这一壁垒,没有规则也意味着信息损失更小、上线更高,说人话就是:更聪明、更拟人。与此同时,“端到端”的模型同样还具备高效算力和高效迭代两大优势。得益于双系统 + 世界模型的研发体系,理想智能驾驶AI模型的迭代效率非常快。在三个月的时间内,迭代了30个版本,每周迭代 2个版本给鸟蛋和千人团用户,快速进化演进出更好的体验。然而,作为行业首个全量推送车位到车位的智驾,光靠“端到端”显然还不够,毕竟只喂一个数据就会存在误判的可能性,尤其是面对各种不同的场景,甚至是信号灯的形状、类别,因此这套系统不仅需要“端到端”的快,更需要像老司机一样思考问题,能有逻辑推断,才能真正实现类人智驾,于是理想为这套“端到端”增加了一个好帮手,视觉解决方案——VLM。 如果说“端到端”是快系统,那VLM则代表了慢系统,因为它的出现就是为了去更加深刻的理解物理世界的复杂交通环境,并进一步加强解决安全、导航、法规和舒适等方面的难题,而这恰恰也是各大车企在做智驾方案时的一大难点。当然,回归到用户本身,他们更在意的一定是智驾的好用程度,判断依据很简单,就是这套系统是否足够类人,而类人化的结果其实就是高效、有逻辑判断。尤其是在此次升级OTA 6.5后,真正实现“车位到车位”的泊出泊入,全程智驾,所以,智驾过程中的表现更是会被无限放大。 而从实际的体验上来看,这套VLM完全能够应用于我们生活中的大部分场景,比如传统驾驶辅助很难判定的有时间限制的公交车道、潮汐车道甚至坑洼路面等,它都可以轻松识别,从而大大提升通行效率以及不同路线的选择。不过,以上这些功能,其实在OTA 6.4的时候就已经具备,而真正实现全程智驾的功能亮点正是OTA 6.5之后的ETC通行能力。这一场景的应用原理也是由VLM识别收费站及ETC通道位置,最终引导“端到端”系统向ETC通道行驶并通过闸机。因此在我看来,这项行业首创的功能,它不仅打破了智驾的壁垒,也将“车位到车位”从口号变成了现实。当然,想成为智驾的顶流,除了“端到端+VLM”的技术外,它还需要一个配合——“世界大模型”。用通俗易懂的话来解释,它就好像一个题海库一般,由专业测试人员和内测车主,为其提供大量实车测试过程中遇到的问题以及各种真实场景,同时,会用生成模型将考题进行泛化形成模拟题,比如改变了天气、光照、背景环境、障碍物的行为等,使得模型能够举一反三,最终在这套“题海库”内生成一个错题库、真题库和模拟库。于是,得益于这套题库的存在,在每次模型发布之前,技术人员都会将新的系统和模型把错题再模拟一次,最终通过实际测试结果将它和其他功能进一步匹配,从而实现一个完全自动化的进化过程。而在这一套复杂且严密的逻辑模拟背后,恰恰是理想以用户为中心,力求带来更好的产品体验的理念。作为行业首个全量推送“车位到车位”的车企,理想其实早早就开始布局智驾,从NPN到无图NOA,再到“端到端”的转变,理想之所以能在智驾层面突破传统壁垒,实现多项行业首创、成为新的天花板,我想这不仅仅是品牌在智驾层面的决心与努力,更是展现了以用户为核心的理念以及对于科技的不断探索精神。