一段式端到端大模型上车,智己为智驾系统注入“直觉”

全文2215字,阅读约需7分钟,帮我划重点

划重点

01智己汽车宣布IM AD 3.0率先完成从“最像人”到“有直觉”的断代式进化,迈入“直觉”智驾新时代。

02一段式端到端大模型作为核心技术底座,使智己汽车智驾系统具备快速学习、快速进化的能力。

03由于此技术,智己汽车智驾系统在应对复杂场景时,能够像人类驾驶员一样,凭借直觉脑补预判,迅速作出规避动作。

04目前,智己IM AD智驾安全水平已达到人类驾驶的6.7倍,常用IM AD智驾的用户,比不用智驾的用户,安全行驶里程提升了3.1倍。

05除此之外,智己汽车已成为全国首个同时具备L2、L3、L4智能驾驶量产能力的品牌。

以上内容由腾讯混元大模型生成,仅供参考

让智能驾驶拥有人类的直觉,而且具备快速学习、快速进化的能力,在面对复杂的城市环境、无中线的超宽车道、盲区等场景时或未知障碍时,智驾系统也能够如同人类驾驶员一样,凭借直觉脑补预判,迅速作出规避动作。

如此理想的智驾技术,智己汽车已经将其变成现实。

10月28日,主题为“直觉·新时代”的智己智能驾驶技术日上,智己汽车宣布IM AD 3.0率先完成从“最像人”到“有直觉”的断代式进化,为智驾系统率先注入人工智能生成的“直觉”,正式迈入“直觉”智驾新时代。

图片

所谓“直觉”,智己汽车联席CEO刘涛援引诺贝尔奖得主、心理学家丹尼尔•卡尼曼的研究指出,人类大脑有两个系统,系统一是“直觉推理”,系统二是“逻辑分析”。其中“直觉”是一种快速自发响应,也是非线性的,而且要依赖丰富的经验积累。

虽然人类大脑有这两个系统,但通常依赖系统一进行快速、直觉的判断,这种思维方式在我们的生活中占据了大约95%的时间,而逻辑分析只覆盖了其余5%的场景。由于目前的智能驾驶对“直觉”的使用接近于0,基本上都依靠逻辑分析,因此在有些方面无法做到“类人”的体验。

智己汽车的“直觉驾驶”让智能汽车首次拥有了综合分析道路环境全局信息,尤其在应对突发状况时,能够“脑补”出看不见、看不全的路况信息,像人类高级思维一样可以做出瞬间预判,即人们通常所说的“直觉”或“下意识反应”;即使在最复杂的交通环境中,都做到真正老司机般“看路开车”的驾驶方式。

图片

例如,在占道修路的路段,对向一个车道被临时划作本方向的车道,常规的智驾基本上会退出,需要人类驾驶员接管,因为规则它不允许跨越实线直线,但有直觉的智能驾驶,会综合分析整个路面场景,果断做出全局判断,借道行走。

在面对通用障碍物、导航变道等没见过的场景,IM AD3.0可以做到智慧闪躲、灵活自主变道;遇到无保护左/右转汇入等复杂路口,IM AD3.0兼顾安全与效率,表现更像老司机。

在面对人车混流的无保护左转场景时,IM AD3.0能够像老司机一样老练博弈不傻等;遇到盲区、红绿灯遮挡、无保护左转、无中线、超宽车等看不见的路况,IM AD3.0也能流畅通行,不只是动作更像人,思考也更像人。

IM AD3.0能够以更接近人脑结构的思考方式,生成本能反应主导的直觉决策能力,这背后的核心技术底座就是智己汽车与Momenta联合打造的“一段式端到端直觉式智驾大模型”。

图片

“端到端”大模型上车已经成为智能驾驶行业的普遍技术方案,不过由于端到端的下限不可控,更多企业采用的还是分段式或者分模块的“端到端”,分别进行“端到端”的模型训练。

Momenta CEO曹旭东认为,分模块做感知和预测,一方面很机械化,另一方面在过程中会有很多的重要的信息出现偏差回落,使得整体智驾不能符合用户预期,但是一段式端到端方案更符合人类大脑的运行原理。

曹旭东介绍一段式端到端大模型真正取消了“感知+规划”这样的分模块智驾结构,而是将感知与规划整合进一个大模型,从来自各种传感器的原始数据输入,直接生成车辆的路径规划信息,形成人脑高级思维中的快速直觉般的反应,让自驾体验更加人性化。

一段式端到端大模型不再依赖感知模型,而是通过来自数据飞轮提供的海量数据,训练一个完整的神经网络,分析全局信息、隐含信息,学习优秀的人类驾驶行为

例如,相比于传统方法需要人为定义“水坑”类型并使用大量数据训练感知模型来识别水坑、再训练规划模型绕开水坑,一段式端到端无需预先定义“水坑”类型,而是依赖直接学习来规避水坑。通过这种方式,一段式端到端能够更好地处理隐藏的极端场景,具备更强的性能、迭代效率更高、进化速度更快,从而提供更优的驾驶体验。

这个算法不再仅仅依赖高清地图,而是通过海量数据训练,积累了亿级别的事件优质数据,结合领先的2.5 EFLOPS云端算力,打造出了真正能够应对复杂场景的智驾。

一段式端到端智驾大模型实现了从算力堆砌到算法优化的升维,通过行业首创的“长短期记忆模式”独特架构,在将模型训练成本节省10-100倍的同时,大幅提升了系统性能和效率。

图片

Momenta采取长短期记忆结合的方式,来训练智驾大模型,这也是仿造了人类记忆的一个过程,就是外界大量的信息数据首先会进入短期记忆,再经过短期记忆的筛选验证,之后才会进入长期记忆,形成习得的能力和经验。

曹旭东解释,“短期记忆的训练成本比较低,可以据此验证新模型是不是正确的,以及用于训练的数据是不是正确的,训练的周期也会比较短,平均一天就能迭代一个版本”。最终,经过短期记忆被验证过的好的方法、好的数据在积累一段时间之后,再进入“长期记忆”,这样能够保证长期记忆的训练,基本上一次训练就能训练得对。

Momenta已经有了密集的、优质的数据积累,数据量以指数级的爆发方式增长,到2027年的时候,数据积累预计会突破1000亿公里,彻底解决自动驾驶的长尾问题。

在一段式端到端大模型的赋能下,IM AD大幅提升了智驾安全性。目前,智己IM AD智驾安全水平,已达到人类驾驶的6.7倍。常用IM AD智驾的用户,比不用智驾的用户,安全行驶里程提升了3.1倍,事故发生的概率更小。

不仅如此,智己还宣布已经成为全国首个同时具备L2、L3、L4智能驾驶量产能力的品牌。

图片

其中L2+级高阶辅助驾驶,已于10月在全国范围内开通全系车型“无图城市NOA”,覆盖全新L7、LS7(激光雷达版本)、LS7 Max、LS6以及L6车型,做到“全国都好开、全场景都敢开”。近日智己又已启动欧洲市场的L2+道路测试,为智驾出海打造首个“全球都能开”的无图NOA。

智己的L3级自动驾驶也已进入量产倒计时。今年6月,智己入选全国首批“L3准入及路试联合体名单”,预计将于2026年正式具备L3级自动驾驶方案的量产条件。

预计在今年内,智己将获得首批“L4级无驾驶人道路测试牌照”,实现无人驾驶车率先上路。

值得注意的是,智己的L2、L3、L4自动驾驶采用共平台开发,一方面通过大量L2工程实践、数据获取和训练,支撑L3、L4研发,另一方面可将L3、L4科技成果,充分赋能到现在的L2场景,实现更安全、舒适的智驾体验。