红星资本局8月31日消息,8月30日,第二十七届成都国际车展拉开序幕,理想汽车(02015.HK/LI.US)公布了端到端模型、VLM视觉语言模型和世界模型自动驾驶技术架构的最新进展与未来规划,并宣布基于端到端及VLM视觉语言模型的全新一代理想智能驾驶正式开启万人体验团招募。此外,理想OTA6.2正式全量推送。
理想汽车智能驾驶研发副总裁郎咸朋、智能驾驶高级算法专家詹锟在发布会后接受了包括红星资本局在内的媒体群访。
郎咸朋(右)、詹锟(左)
据詹锟介绍,所谓端到端,指的是一种研发的范式,做一个任务,从最开始的输入端到最后的输出端,中间没有其他的过程,用一个模型完整从输入到输出。应用到自动驾驶领域,意味着只用一个模型,就能把摄像头等传感器收集到的感知信息,转换成车辆的操作指令。
2023年初,特斯拉(TSLA.US)就提到了端到端。目前多家车企都在卷端到端,但思路与进展各不相同。在詹锟看来,相比模块化的端到端,一体化(OneModel)端到端是更本质的端到端。
郎咸朋表示,“我们对智驾核心的思路就是端到端+VLM,我们认为这个方式是更接近于人类驾驶更有前途的智能驾驶方案。”
在郎咸朋看来,端到端+VLM技术架构,本质上是人工智能方案。“从现在开始,我们是真正地用人工智能的方式做自动驾驶。”他认为,在这个前提下,自动驾驶研发的核心竞争是是否有更多更好的数据和与之配套的算力去训练模型,而训练数据、训练里程是用钱买不到的。
他透露,理想汽车当前训练算力达到5.39EFLOPS,预计到2024年底将超过8EFLOPS。理想汽车每年在训练算力的投入超过10亿元人民币,今年要消耗20亿人民币。“我们认为最终实现自动驾驶需要的训练算力要达到100EFLOPS的量级,折合成投入每年要超过10亿美元。”
对于世界模型,郎咸朋指出,在有监督(L3级别及以下)的自动驾驶上,发挥更大作用的还是端到端模型、VLM视觉语言模型,“因为在有监督的自动驾驶需求下,端到端模型已经足够用了,VLM只是起到一个提醒辅助的作用”。但是到无监督L4级别自动驾驶之后,这套系统要独立处理所有的未知场景和突发情况,模型参数量剧增,这时就需要车端的世界模型。
接管率是体现系统能力的核心指标之一。据介绍,理想汽车已经提升到超21公里才接管一次。未来能够提升到百公里接管一次。不过如果长时间不用接管,人的精神注意力会不集中。理想汽车会通过全新的交互体验,让司机在该接管的时候可以做到接管,并通过评测高频接管的场景地区,提前推送给用户。
相比友商,理想汽车目前并未对高阶智驾收费。郎咸朋强调,标配和免费都是理想从第一天开始进入智能驾驶就制定的策略,有监督的自动驾驶对所有AD Max的车主都是不收费的。“交付量是非常重要的一个衡量指标,对于我们来说不是单纯卷交付量,而是还能为自动驾驶提供更多的车辆训练里程。交付量比较好且企业经营稳健,也有足够的资源投入智驾研发。”
郎咸朋去年表示,理想汽车的智驾与特斯拉FSD的差距在半年左右,在此次的成都车展上,他表示“今年(双方的差距)可能还会再小一点”。
他解释道,第一,从技术架构上,理想汽车跟特斯拉没有太大差别,甚至更领先一点,“因为我们有VLM,有系统2,特斯拉只是有系统1,端到端”。
第二,在中国的训练算力和训练数据上,“至少从现在看我们是领先于特斯拉的,因为特斯拉在数据合规性等方面都受到约束,在中国的训练算力的部署还需要搭建。在这个层面上看,我们在中国跟特斯拉的差距可能并没有那么大,我们也特别希望特斯拉能加入进来,互相学习,专注做自身的提升。”
红星新闻记者 吴丹若
编辑 杨程