理想为啥说自己是一家AI公司?

全文5768字,阅读约需17分钟,帮我划重点

划重点

01理想汽车CEO李想在2024理想AI Talk活动上强调,理想汽车不是汽车企业,而是人工智能企业,未来将全力投入人工智能领域。

02李想表示,AI对于理想意味着未来的全部,公司计划在2030年成为全球领先的人工智能企业。

03为此,理想汽车自研大模型Mind GPT,并在手机端上线了基于Mind GPT的AI Agent应用“理想同学”。

04然而,理想汽车在智能驾驶领域的竞争对手众多,包括蔚来、小鹏、吉利等头部厂商。

05李想认为,实现L4级别的自动驾驶将使家用车更便宜、更智能,有望吸引更多消费者。

以上内容由腾讯混元大模型生成,仅供参考

图片

文丨李丹

编辑丨赵磊

理想不是汽车企业,是人工智能企业。2024理想 AI Talk 活动直播间中,理想汽车CEO李想重申了公司的愿景,“AI对于理想意味着未来的全部”。

作为投入智驾几乎最晚的新能源车企,到宣布要做一家人工智能企业,短短两三年里,理想从上到下发生了许多深刻的转变。在这场3天的活动里,许久没有露面的李想回答了很多问题,解释了这种转变是如何发生的,也抛出了一些新的思考。

活动的最后一天,基于理想自研的Mind GPT大模型,一款AI Agent应用“理想同学”在手机端上线。从此,理想的竞争对手除了其他车企,还多了文心一言、Kimi、豆包。而造车,被降格为理想实现AGI的一个具体场景:除了智能汽车和智能助手,在李想对未来的设想中,还会做人形机器人,做一切AI可能的载体,只要理想能掌握人工智能时代的“操作系统”——一个自己的基座模型。

毫无疑问,这是迄今李想对人工智能的最明确的表态。理想到底为什么要做大模型?做大模型对理想卖车有什么意义?如今理想的大模型做得怎么样?我们总结了李想的一些观点,整理了相关事实,试图对这些问题有更明确的了解。

“理想不是汽车企业,是人工智能企业”

 观点

李想把理想汽车重新定位为一家人工智能企业,理想还会继续造车,但是会把汽车作为人工智能时代的空间机器人,把汽车作为理想人工智能的一个应用场景。

关于AI战略,理想内部做了非常长时间的讨论,李想的态度相当坚决,“我们要是在未来不做人工智能,我们什么都不是”。基于此,理想在2023年年初把人工智能提升到战略高度,将公司的愿景调整为“2030年,成为全球领先的人工智能企业”,以此吸引更多的人才。

李想表示,为了这个愿景,理想一年超过100亿的研发投入,有接近一半是投在了人工智能方面,包括自研基座模型、端到端和VLM(Vision Language Model 视觉语言模型),除了应用在智能驾驶,还有理想同学(智能助手)、智能商业和智能工业。

“AI对于理想来说意味着未来的全部。”李想说。

 事实

要如何成为一家AI公司?理想给出的答案是自研大模型Mind GPT。

理想在2023年一季度开始了Mind GPT项目,并在2023年6月的理想家庭科技日发布会上发布,到2023年年底,OTA 5.0发布,Mind GPT上车。

但理想并不是汽车行业唯一讲大模型故事的车企。早在2023年上半年,ChatGPT爆火不久,汽车行业就迎来一轮对大模型的追捧,尤其在智驾领域,都想让大模型上车。实际上,汽车行业大模型与GPT-4、Gemini等头部大模型还有不同,部署在车端的智驾模型往往参数量小,只能解决特定问题,而在云端预训练一个大模型,进行数据标注和场景挖掘也是头部车企与智驾供应商的主流做法。

目前,将生成式大模型部署在智能座舱中,让车机变得更智能,已经是行业标配,不过大多数是引入第三方大模型公司的产品,选择自研的较少。除理想外,蔚来小鹏吉利等头部厂商也选择自研,智能座舱体验提升也成为各家产品的新卖点。

但到底哪家车企的大模型更好用,有很多因素影响,一是模型本身参数规模,二是车企自身积累的数据质量,三是车企对场景的理解,以及软硬件结合的能力。

从训练数据的规模、投入力度看,理想的Mind GPT大模型在汽车行业处于前列,也是首个通过国家《生成式人工智能服务管理暂行办法》备案的汽车厂商自研大模型。在这次AI talk活动后,基于Mind GPT的“理想同学”App上线手机端,Mind GPT 3.0将在年底上线,理想比其他车企早一步参与到大模型行业的竞争中。

图片● 2024年11月23日,2024广州国际车展,市民体验理想汽车。图源:视觉中国

“自研基座模型是分水岭,理想一直在做,且要做到全国前三”

 观点

对新能源汽车行业来说,电动化是上半场,智能化是下半场。李想认为,在AI时代,每一家企业都应该是一家人工智能企业,而人工智能最关键的是做软件的能力,就像智能手机时代最重要的是操作系统、应用商店和云服务,能不能做基座模型,是目前几百家电动车企业的一个分水岭。

李想认为基座模型是人工智能时代的操作系统+编程语言,它所构建出来的超级产品,会是新一代的入口,在所有的设备之上,在所有的服务之上。目前理想同学已经上了手机,未来还可能上电脑、眼镜。

本来,智能助手理想同学和智能驾驶是两种类型的智能,一种是生成式大语言模型,是语言智能,另一种是执行特定任务的行为智能,两种模型技术架构不同,能力也不同。但李想认为,这两种模型最终会结合在一起,变成VLA(Vision-Language-Action Model,一种结合了视觉、语言和动作的多模态模型),真正成为一个认知、理解世界并做出独立决策的智能体。目前,理想已经开始这方面的预训练,给语言模型投喂三维向量token。

李想要求团队至少在中国的范围内,未来几年在大语言基座模型方面必须做到行业前三,要跟头部企业去竞争,而不限于汽车行业。为了这个目标,需要多少的训练算力都愿意投资。而在空间智能(智能驾驶)上,李想给团队定的目标是明年成为中国第一。

 事实

此前,理想无论是在智能驾驶还是在大语言模型方面,都不在第一梯队,但定下的目标很高。而想让大语言模型和智驾模型结合在一起,更没有可行的技术路径,这些都需要大量的技术和资金投入。

单看智能驾驶,今年掀起的端到端竞赛,就已经是一场比拼资源的耐力赛。端到端本身是追随特斯拉的路线,今年4月,马斯克曾表示,对英伟达H100芯片的采购量将从3.5万增加到8.5万,并计划投资100亿美元用于汽车的联合训练和推理人工智能。理想也不例外,持续加大对云端算力的投入,目前理想租卡的费用高达10亿人民币,未来可能需要每年10亿美金。

端到端和大模型一样,讲究“大力出奇迹”,投入的算力越大,数据质量越高,效果就越好,最终是销量的比拼,只有高销量支撑下的良好现金流,才能支撑这样的投入,更多车跑在路上,也能更快积累数据。

今年,理想在销量上面临很大的挑战。2月份,理想汽车宣布全年销量目标为80万辆;3月份,下调至56万-64万辆;第二季度业绩会上,又将全年销量目标下调至50万辆。从10月份开始,理想已经连续两个月出现销量环比下滑,截至11月底,全年交付441995辆,离目标尚有距离。

而在大语言模型上,“六小虎”和字节等大厂也在激烈角逐中,2024年“六小虎”至少融了200亿元,烧钱依旧看不到尽头。在新能源行业惨烈厮杀,比拼智驾的当下,理想很难真正拿出许多资源投入到大语言模型的研发上。

但是,汽车行业尤其是智驾领域,经常是“因为相信,所以看见”,讲的故事越宏大越美好,越可能拿到更多的投资、越容易得到消费者的认同、越能吸引更多的人才。

正如李想所说,“团队要按照这个要求来制定自己的目标,构建能力,以及确定我们的组织和投资,我觉得这个节奏还是非常重要的”。把目标定得高些,才能比预想走得更远。

“理想不会做Robotaxi,但100%会做机器人”

 观点

在李想的设想中,AGI的终极阶段是“硅基家人”,不需要再给它任何指示,不需要给它分配任务,就是家庭的组织者,主动干很多事情,自主衡量判断,帮他把家庭管理好。

之所以称为“硅基家人”,是因为理想的品牌使命是“创造移动的家,创造幸福的家”。在李想看来,实现L4级别的自动驾驶就是“移动的家”,而“幸福的家”就是他理想中的硅基家人。因此,他不会像马斯克一样做Robotaxi,不认为Robotaxi到来后就没人开车了,而是认为L4会使家用车更便宜、更智能,当一个空间变得更好,效率更高,体验更好的时候,愿意拥有一辆车的人会变得更多。

未来出行到底是Robotaxi还是自动驾驶汽车,他觉得未来几年就会见分晓。

而今年一直很火的人形机器人,李想表示,未来100%会做,但不是现阶段该做的事情。他认为车是无接触、标准化的机器人,如果车都无法实现L4,怎么让更复杂的机器人去解决更难的问题?

 事实

从诞生起就奔着L4而去的Robotaxi公司们,一直讲的故事就是将丰田、大众等整车厂变为自己的代工厂,当Robotaxi到来,人们的出行成本大幅降低,相比拥有一辆车,使用Robotaxi会更省钱、更方便。

但理想从创立起,就以家庭为目标客群,注重家用场景的需求,努力把车打造为“移动的家”。这样的定位,影响了理想的技术路线、产品设计、营销定价等方方面面,也帮助理想在家庭用车领域确立起优势地位。

但从长远来看,Robotaxi实现后一定会大幅降低用车需求,这对以卖车作为核心商业化方式的理想来说,依然是不利的。另一方面,L4的实现预计要比“硅基家人”快得多,比如李想的目标是三年内推出把方向盘摘掉的产品,100%实现自动驾驶,而“硅基家人”要求人工智能达到L5阶段,李想希望是在自己有生之年内看到。

从L4的实现路径来讲,特斯拉和理想是一致的,目前也是业内更被认可的一条路径,即渐进式路线,从L2到L4可以持续将能力提升转变为商业优势,让企业走得更远。理想的优势在于,有更多的车在路上跑,积累了大量的路测数据,这在目前以端到端实现L3的竞争中显得更有潜力。

图片● 2018年10月18日,北京,车和家CEO李想发布车和家首款车型“理想智造ONE”。图源:视觉中国

“最晚最慢投入智驾,是在等钱、等数据”

 观点

“不是不想搞(智驾)自研,而是融到的钱勉强满足了产品研发、自建工厂、供应链和服务体系的建设,还要给团队发工资。”这是李想曾经发过的一条微博。

在这次访谈里,李想又一次回应为何这么晚才做智驾,认为这是创业节奏的问题,“作为一个连续创业者,一个最大的好处是知道整个企业发展的节奏,就是从0到1先解决什么问题,有了收入以后,从1到10要做什么事情,这个其实是我跟新进入行业的创业者,一个根本性的不同”。

李想回顾了理想的发展历程,表示理想早期融资能力很差,钱很少,第一个想的是怎么把产品做好,等到了2020年和2021年在美国和香港上市,有了更多的钱,又去做技术平台化,“它是一个创业公司往上成长、资源有限的情况下,和资源增长以后,你分别去投资什么的一个进展”。

包括做端到端,理想智驾负责人郎咸朋说,是在等足够的数据和算力,等够了才上。

 事实

在智能驾驶领域,理想一直被视作“后进生”。理想从2021年才开始自研智能驾驶,是蔚小理中最晚进场的,在这个时间点,另外两家都已实现了辅助驾驶落地。

前期有限的资金应该首先投入产品,把车造好、卖好。从销量来看,这个决策是正确的。据理想2023年年报,理想汽车的销量为37.6万辆,较上一年增长了近3倍,全年营收高达1238.5亿元,成为继特斯拉、比亚迪之后的全球第三家盈利的新能源车企。

但是,到了2023年,智驾能力逐渐成为销量的重要影响因素,辅助驾驶已经无法满足理想诸多高端车型的配置要求,尤其在华为凭借智驾以及营销成为理想最大的对手后,智驾这块最大的短板,理想必须尽快补上。在理想2023秋季战略会上,李想的态度是“2024年要成为智驾的绝对头部”。

某种程度上,理想是在一种危机感之下,才开始激进投入智驾,一边是在市场激烈的竞争压力下,要实现百城NOA开城目标,使用NPN(依然需要高精度地图),结果被质疑虚假宣传;意识到问题后,迅速开始无图NOA的研发攻坚,4个月就开启内测,今年7月全量推送;而在今年端到端的竞赛中,理想再也不想落后,使用了更加激进的one model,以及端到端+VLM(视觉语言大模型)双系统方案,快速提升了智驾能力。

在投入巨大的智驾研发上,钱和数据永远没有充分准备好的那天,到那时可能黄花菜都凉了,但是销量下滑和市场竞争可以让一家公司快速意识到危险,选择all in。

“要么做端到端,要么不再做自动驾驶”

 观点

理想目前使用的智驾框架是只有一个模型的端到端,也就是输入的感知模型和输出的决策控制模型是同一个,而一些车企使用的是双模型,一个负责感知,一个负责决策,中间再串起来。

在李想看来,之所以用一个model,是听取了王兴、陆奇等人的建议,感知和决策同时进行,更像人的工作模式。李想还让智驾团队去美国开FSD V12,认为这才是正确的方向,而不是传统的多模块,靠一些人为制定的规则去连接,“今天你靠这些规则上来做的,跟请个供应商做出来的东西有啥区别?没有啥区别。”

理想像特斯拉一样采取了one model的端到端,但是却保留了激光雷达,被外界质疑是不是技术不行,对此,李想的回应是,还是为了安全,“如果马斯克在中国,在深夜里不同的高速开过车,他也会选择把前面的一颗激光雷达保留下来”。

 事实

在做端到端之前,理想有过频繁的转变。先是尝试了NPN方案,喊出了城市NOA落地100城,半年后,宣传口径从“城市NOA100城”改成了“通勤NOA100城”。又在推进过程中意识到在偏远地区行不通,于是快速切换了无图方案。

今年10月23日,理想宣布端到端+VLM(视觉语言大模型)正式全量推送,且是真正意义上one model的端到端。

这些试错都发生在一年的时间内。能够如此高效、快速地调整方向,策略之一是对标特斯拉。在智驾一号位郎咸朋看来,技术研发的确需要时间,但需要的不是研发时间,而是试错时间。而特斯拉试错走不通的地方,理想就不走了。“选 NPN 还是无图?既然特斯拉跑出来了,那理想就选无图。”

而无图方案的问题是,有解决不完的Corner Case(极端情况)。解决Corner Case 需要更多的人力和资源,理想的人力和资源有限,或者是不愿意投入更多,最终端到端就成了“灵丹妙药”。

从销量表现来看,这个方案的确做到了让用户买单。2月智驾系统AD Max的交付量占比只到20%左右,到今年下半年已经超过50%。

但是如此激进的转变,也会被外界质疑是否影响安全性。出于安全兜底的考虑,理想的端到端方案保留了毫米波雷达,同时加上了一个VLM系统,加强处理复杂未知场景的能力,做慢思考和长时决策,进一步加强安全保障。

目前,one model的端到端更符合智驾长远趋势,但作为一个黑箱,也存在不可解释、出现问题难溯源的风险,可能导致严重的事故,也更难满足测试、认证的要求。

但理想这次是铁了心,一定要成为行业绝对的头部。这次活动中也预告,高速城市全场景升级端到端+VLM,将于12月31日全量推送AD Max用户。

图片● 理想端到端+VLM的技术方案。图源:理想汽车官方

“理想今天在做的所有事情,都是为了拿门票”

 观点

就像汽车的电动化和智能化是两场仗,电动化是没有资源的车企的一张门票,李想觉得,无论是通用人工智能还是自动驾驶,现在都在非常初级,在拿门票的阶段。理想今天做的所有事,都是在拿门票,在为AGI的L3(智能体)、自动驾驶的L4准备资金、数据和能力。

理想同学目前的重心是希望能够实现从L1 ChatBot(聊天机器人)到L2(推理者)的变化。

而电动车这场仗,最终会在L4分出胜负。李想给出了几个条件,第一,足够多的车跑在路上,得500万辆以上。第二,要掌握VLA这个基座模型的能力。第三,要足够多的钱,招募最顶级的人才,拥有足够算力。

但有了门票还不够,永远不存在打赢打不赢,竞争总是在发生变化,一开始是特斯拉、新势力、传统车企,后来华为来了,小米来了,“这就是世界的精彩和丰富之处”。

 事实

两个多月前,理想第一百万辆整车下线,成为中国首个达成百万交付的新势力品牌。

在电动化的上半场,理想取得了优异的成绩;在智能化下半场刚刚开启之时,理想成为那个奋起直追补短板的人。电动化和智能化的门票,理想都已拿到,而在AGI这条路上,理想还是个新手。一切都没有到终局,一切都有可能。

(理想AI Talk完整访谈,可见《独家 | 与李想的3小时对谈》,腾讯科技)

 参考资料:

晚点Auto:《对话理想智驾郎咸朋、贾鹏,一个后进生,怎么提前交卷了?》

远川汽车评论:《大模型上车:先打广告 再看疗效》

36氪:《理想智能驾驶围绕「端到端」变阵,加速AI大模型上车》