+关注

手机看

微信扫一扫，随时随地看

理想为啥说自己是一家AI公司？

镜相工作室

2024-12-29 09:48发布于北京九派新闻镜相工作室官方账号

+关注

AI划重点 · 全文约5768字，阅读需17分钟

1.理想汽车CEO李想在2024理想AI Talk活动上强调，理想汽车不是汽车企业，而是人工智能企业，未来将全力投入人工智能领域。

2.李想表示，AI对于理想意味着未来的全部，公司计划在2030年成为全球领先的人工智能企业。

3.为此，理想汽车自研大模型Mind GPT，并在手机端上线了基于Mind GPT的AI Agent应用“理想同学”。

4.然而，理想汽车在智能驾驶领域的竞争对手众多，包括蔚来、小鹏、吉利等头部厂商。

5.李想认为，实现L4级别的自动驾驶将使家用车更便宜、更智能，有望吸引更多消费者。

以上内容由腾讯混元大模型生成，仅供参考

文丨李丹

编辑丨赵磊

理想不是汽车企业，是人工智能企业。2024理想 AI Talk 活动直播间中，理想汽车CEO李想重申了公司的愿景，“AI对于理想意味着未来的全部”。

作为投入智驾几乎最晚的新能源车企，到宣布要做一家人工智能企业，短短两三年里，理想从上到下发生了许多深刻的转变。在这场3天的活动里，许久没有露面的李想回答了很多问题，解释了这种转变是如何发生的，也抛出了一些新的思考。

活动的最后一天，基于理想自研的Mind GPT大模型，一款AI Agent应用“理想同学”在手机端上线。从此，理想的竞争对手除了其他车企，还多了文心一言、Kimi、豆包。而造车，被降格为理想实现AGI的一个具体场景：除了智能汽车和智能助手，在李想对未来的设想中，还会做人形机器人，做一切AI可能的载体，只要理想能掌握人工智能时代的“操作系统”——一个自己的基座模型。

毫无疑问，这是迄今李想对人工智能的最明确的表态。理想到底为什么要做大模型？做大模型对理想卖车有什么意义？如今理想的大模型做得怎么样？我们总结了李想的一些观点，整理了相关事实，试图对这些问题有更明确的了解。

“理想不是汽车企业，是人工智能企业”

● 观点

李想把理想汽车重新定位为一家人工智能企业，理想还会继续造车，但是会把汽车作为人工智能时代的空间机器人，把汽车作为理想人工智能的一个应用场景。

关于AI战略，理想内部做了非常长时间的讨论，李想的态度相当坚决，“我们要是在未来不做人工智能，我们什么都不是”。基于此，理想在2023年年初把人工智能提升到战略高度，将公司的愿景调整为“2030年，成为全球领先的人工智能企业”，以此吸引更多的人才。

李想表示，为了这个愿景，理想一年超过100亿的研发投入，有接近一半是投在了人工智能方面，包括自研基座模型、端到端和VLM（Vision Language Model 视觉语言模型），除了应用在智能驾驶，还有理想同学（智能助手）、智能商业和智能工业。

“AI对于理想来说意味着未来的全部。”李想说。

● 事实

要如何成为一家AI公司？理想给出的答案是自研大模型Mind GPT。

理想在2023年一季度开始了Mind GPT项目，并在2023年6月的理想家庭科技日发布会上发布，到2023年年底，OTA 5.0发布，Mind GPT上车。

但理想并不是汽车行业唯一讲大模型故事的车企。早在2023年上半年，ChatGPT爆火不久，汽车行业就迎来一轮对大模型的追捧，尤其在智驾领域，都想让大模型上车。实际上，汽车行业大模型与GPT-4、Gemini等头部大模型还有不同，部署在车端的智驾模型往往参数量小，只能解决特定问题，而在云端预训练一个大模型，进行数据标注和场景挖掘也是头部车企与智驾供应商的主流做法。

目前，将生成式大模型部署在智能座舱中，让车机变得更智能，已经是行业标配，不过大多数是引入第三方大模型公司的产品，选择自研的较少。除理想外，蔚来、小鹏、吉利等头部厂商也选择自研，智能座舱体验提升也成为各家产品的新卖点。

但到底哪家车企的大模型更好用，有很多因素影响，一是模型本身参数规模，二是车企自身积累的数据质量，三是车企对场景的理解，以及软硬件结合的能力。

从训练数据的规模、投入力度看，理想的Mind GPT大模型在汽车行业处于前列，也是首个通过国家《生成式人工智能服务管理暂行办法》备案的汽车厂商自研大模型。在这次AI talk活动后，基于Mind GPT的“理想同学”App上线手机端，Mind GPT 3.0将在年底上线，理想比其他车企早一步参与到大模型行业的竞争中。

● 2024年11月23日，2024广州国际车展，市民体验理想汽车。图源：视觉中国

“自研基座模型是分水岭，理想一直在做，且要做到全国前三”

● 观点

对新能源汽车行业来说，电动化是上半场，智能化是下半场。李想认为，在AI时代，每一家企业都应该是一家人工智能企业，而人工智能最关键的是做软件的能力，就像智能手机时代最重要的是操作系统、应用商店和云服务，能不能做基座模型，是目前几百家电动车企业的一个分水岭。

李想认为基座模型是人工智能时代的操作系统+编程语言，它所构建出来的超级产品，会是新一代的入口，在所有的设备之上，在所有的服务之上。目前理想同学已经上了手机，未来还可能上电脑、眼镜。

本来，智能助手理想同学和智能驾驶是两种类型的智能，一种是生成式大语言模型，是语言智能，另一种是执行特定任务的行为智能，两种模型技术架构不同，能力也不同。但李想认为，这两种模型最终会结合在一起，变成VLA（Vision-Language-Action Model，一种结合了视觉、语言和动作的多模态模型），真正成为一个认知、理解世界并做出独立决策的智能体。目前，理想已经开始这方面的预训练，给语言模型投喂三维向量token。

李想要求团队至少在中国的范围内，未来几年在大语言基座模型方面必须做到行业前三，要跟头部企业去竞争，而不限于汽车行业。为了这个目标，需要多少的训练算力都愿意投资。而在空间智能（智能驾驶）上，李想给团队定的目标是明年成为中国第一。

● 事实

此前，理想无论是在智能驾驶还是在大语言模型方面，都不在第一梯队，但定下的目标很高。而想让大语言模型和智驾模型结合在一起，更没有可行的技术路径，这些都需要大量的技术和资金投入。

单看智能驾驶，今年掀起的端到端竞赛，就已经是一场比拼资源的耐力赛。端到端本身是追随特斯拉的路线，今年4月，马斯克曾表示，对英伟达H100芯片的采购量将从3.5万增加到8.5万，并计划投资100亿美元用于汽车的联合训练和推理人工智能。理想也不例外，持续加大对云端算力的投入，目前理想租卡的费用高达10亿人民币，未来可能需要每年10亿美金。

端到端和大模型一样，讲究“大力出奇迹”，投入的算力越大，数据质量越高，效果就越好，最终是销量的比拼，只有高销量支撑下的良好现金流，才能支撑这样的投入，更多车跑在路上，也能更快积累数据。

今年，理想在销量上面临很大的挑战。2月份，理想汽车宣布全年销量目标为80万辆；3月份，下调至56万-64万辆；第二季度业绩会上，又将全年销量目标下调至50万辆。从10月份开始，理想已经连续两个月出现销量环比下滑，截至11月底，全年交付441995辆，离目标尚有距离。

而在大语言模型上，“六小虎”和字节等大厂也在激烈角逐中，2024年“六小虎”至少融了200亿元，烧钱依旧看不到尽头。在新能源行业惨烈厮杀，比拼智驾的当下，理想很难真正拿出许多资源投入到大语言模型的研发上。

但是，汽车行业尤其是智驾领域，经常是“因为相信，所以看见”，讲的故事越宏大越美好，越可能拿到更多的投资、越容易得到消费者的认同、越能吸引更多的人才。

正如李想所说，“团队要按照这个要求来制定自己的目标，构建能力，以及确定我们的组织和投资，我觉得这个节奏还是非常重要的”。把目标定得高些，才能比预想走得更远。

“理想不会做Robotaxi，但100%会做机器人”

● 观点

在李想的设想中，AGI的终极阶段是“硅基家人”，不需要再给它任何指示，不需要给它分配任务，就是家庭的组织者，主动干很多事情，自主衡量判断，帮他把家庭管理好。

之所以称为“硅基家人”，是因为理想的品牌使命是“创造移动的家，创造幸福的家”。在李想看来，实现L4级别的自动驾驶就是“移动的家”，而“幸福的家”就是他理想中的硅基家人。因此，他不会像马斯克一样做Robotaxi，不认为Robotaxi到来后就没人开车了，而是认为L4会使家用车更便宜、更智能，当一个空间变得更好，效率更高，体验更好的时候，愿意拥有一辆车的人会变得更多。

未来出行到底是Robotaxi还是自动驾驶汽车，他觉得未来几年就会见分晓。

而今年一直很火的人形机器人，李想表示，未来100%会做，但不是现阶段该做的事情。他认为车是无接触、标准化的机器人，如果车都无法实现L4，怎么让更复杂的机器人去解决更难的问题？

● 事实

从诞生起就奔着L4而去的Robotaxi公司们，一直讲的故事就是将丰田、大众等整车厂变为自己的代工厂，当Robotaxi到来，人们的出行成本大幅降低，相比拥有一辆车，使用Robotaxi会更省钱、更方便。

但理想从创立起，就以家庭为目标客群，注重家用场景的需求，努力把车打造为“移动的家”。这样的定位，影响了理想的技术路线、产品设计、营销定价等方方面面，也帮助理想在家庭用车领域确立起优势地位。

但从长远来看，Robotaxi实现后一定会大幅降低用车需求，这对以卖车作为核心商业化方式的理想来说，依然是不利的。另一方面，L4的实现预计要比“硅基家人”快得多，比如李想的目标是三年内推出把方向盘摘掉的产品，100%实现自动驾驶，而“硅基家人”要求人工智能达到L5阶段，李想希望是在自己有生之年内看到。

从L4的实现路径来讲，特斯拉和理想是一致的，目前也是业内更被认可的一条路径，即渐进式路线，从L2到L4可以持续将能力提升转变为商业优势，让企业走得更远。理想的优势在于，有更多的车在路上跑，积累了大量的路测数据，这在目前以端到端实现L3的竞争中显得更有潜力。

● 2018年10月18日，北京，车和家CEO李想发布车和家首款车型“理想智造ONE”。图源：视觉中国

“最晚最慢投入智驾，是在等钱、等数据”

● 观点

“不是不想搞（智驾）自研，而是融到的钱勉强满足了产品研发、自建工厂、供应链和服务体系的建设，还要给团队发工资。”这是李想曾经发过的一条微博。

在这次访谈里，李想又一次回应为何这么晚才做智驾，认为这是创业节奏的问题，“作为一个连续创业者，一个最大的好处是知道整个企业发展的节奏，就是从0到1先解决什么问题，有了收入以后，从1到10要做什么事情，这个其实是我跟新进入行业的创业者，一个根本性的不同”。

李想回顾了理想的发展历程，表示理想早期融资能力很差，钱很少，第一个想的是怎么把产品做好，等到了2020年和2021年在美国和香港上市，有了更多的钱，又去做技术平台化，“它是一个创业公司往上成长、资源有限的情况下，和资源增长以后，你分别去投资什么的一个进展”。

包括做端到端，理想智驾负责人郎咸朋说，是在等足够的数据和算力，等够了才上。

● 事实

在智能驾驶领域，理想一直被视作“后进生”。理想从2021年才开始自研智能驾驶，是蔚小理中最晚进场的，在这个时间点，另外两家都已实现了辅助驾驶落地。

前期有限的资金应该首先投入产品，把车造好、卖好。从销量来看，这个决策是正确的。据理想2023年年报，理想汽车的销量为37.6万辆，较上一年增长了近3倍，全年营收高达1238.5亿元，成为继特斯拉、比亚迪之后的全球第三家盈利的新能源车企。

但是，到了2023年，智驾能力逐渐成为销量的重要影响因素，辅助驾驶已经无法满足理想诸多高端车型的配置要求，尤其在华为凭借智驾以及营销成为理想最大的对手后，智驾这块最大的短板，理想必须尽快补上。在理想2023秋季战略会上，李想的态度是“2024年要成为智驾的绝对头部”。

某种程度上，理想是在一种危机感之下，才开始激进投入智驾，一边是在市场激烈的竞争压力下，要实现百城NOA开城目标，使用NPN（依然需要高精度地图），结果被质疑虚假宣传；意识到问题后，迅速开始无图NOA的研发攻坚，4个月就开启内测，今年7月全量推送；而在今年端到端的竞赛中，理想再也不想落后，使用了更加激进的one model，以及端到端+VLM（视觉语言大模型）双系统方案，快速提升了智驾能力。

在投入巨大的智驾研发上，钱和数据永远没有充分准备好的那天，到那时可能黄花菜都凉了，但是销量下滑和市场竞争可以让一家公司快速意识到危险，选择all in。

“要么做端到端，要么不再做自动驾驶”

● 观点

理想目前使用的智驾框架是只有一个模型的端到端，也就是输入的感知模型和输出的决策控制模型是同一个，而一些车企使用的是双模型，一个负责感知，一个负责决策，中间再串起来。

在李想看来，之所以用一个model，是听取了王兴、陆奇等人的建议，感知和决策同时进行，更像人的工作模式。李想还让智驾团队去美国开FSD V12，认为这才是正确的方向，而不是传统的多模块，靠一些人为制定的规则去连接，“今天你靠这些规则上来做的，跟请个供应商做出来的东西有啥区别？没有啥区别。”

理想像特斯拉一样采取了one model的端到端，但是却保留了激光雷达，被外界质疑是不是技术不行，对此，李想的回应是，还是为了安全，“如果马斯克在中国，在深夜里不同的高速开过车，他也会选择把前面的一颗激光雷达保留下来”。

● 事实

在做端到端之前，理想有过频繁的转变。先是尝试了NPN方案，喊出了城市NOA落地100城，半年后，宣传口径从“城市NOA100城”改成了“通勤NOA100城”。又在推进过程中意识到在偏远地区行不通，于是快速切换了无图方案。

今年10月23日，理想宣布端到端+VLM（视觉语言大模型）正式全量推送，且是真正意义上one model的端到端。

这些试错都发生在一年的时间内。能够如此高效、快速地调整方向，策略之一是对标特斯拉。在智驾一号位郎咸朋看来，技术研发的确需要时间，但需要的不是研发时间，而是试错时间。而特斯拉试错走不通的地方，理想就不走了。“选 NPN 还是无图？既然特斯拉跑出来了，那理想就选无图。”

而无图方案的问题是，有解决不完的Corner Case（极端情况）。解决Corner Case 需要更多的人力和资源，理想的人力和资源有限，或者是不愿意投入更多，最终端到端就成了“灵丹妙药”。

从销量表现来看，这个方案的确做到了让用户买单。2月智驾系统AD Max的交付量占比只到20%左右，到今年下半年已经超过50%。

但是如此激进的转变，也会被外界质疑是否影响安全性。出于安全兜底的考虑，理想的端到端方案保留了毫米波雷达，同时加上了一个VLM系统，加强处理复杂未知场景的能力，做慢思考和长时决策，进一步加强安全保障。

目前，one model的端到端更符合智驾长远趋势，但作为一个黑箱，也存在不可解释、出现问题难溯源的风险，可能导致严重的事故，也更难满足测试、认证的要求。

但理想这次是铁了心，一定要成为行业绝对的头部。这次活动中也预告，高速城市全场景升级端到端+VLM，将于12月31日全量推送AD Max用户。

● 理想端到端+VLM的技术方案。图源：理想汽车官方

“理想今天在做的所有事情，都是为了拿门票”

● 观点

就像汽车的电动化和智能化是两场仗，电动化是没有资源的车企的一张门票，李想觉得，无论是通用人工智能还是自动驾驶，现在都在非常初级，在拿门票的阶段。理想今天做的所有事，都是在拿门票，在为AGI的L3（智能体）、自动驾驶的L4准备资金、数据和能力。

理想同学目前的重心是希望能够实现从L1 ChatBot（聊天机器人）到L2（推理者）的变化。

而电动车这场仗，最终会在L4分出胜负。李想给出了几个条件，第一，足够多的车跑在路上，得500万辆以上。第二，要掌握VLA这个基座模型的能力。第三，要足够多的钱，招募最顶级的人才，拥有足够算力。

但有了门票还不够，永远不存在打赢打不赢，竞争总是在发生变化，一开始是特斯拉、新势力、传统车企，后来华为来了，小米来了，“这就是世界的精彩和丰富之处”。

● 事实

两个多月前，理想第一百万辆整车下线，成为中国首个达成百万交付的新势力品牌。

在电动化的上半场，理想取得了优异的成绩；在智能化下半场刚刚开启之时，理想成为那个奋起直追补短板的人。电动化和智能化的门票，理想都已拿到，而在AGI这条路上，理想还是个新手。一切都没有到终局，一切都有可能。

（理想AI Talk完整访谈，可见《独家 | 与李想的3小时对谈》，腾讯科技）

参考资料：

晚点Auto：《对话理想智驾郎咸朋、贾鹏，一个后进生，怎么提前交卷了？》

远川汽车评论：《大模型上车：先打广告再看疗效》

36氪：《理想智能驾驶围绕「端到端」变阵，加速AI大模型上车》

查看原图 77K

免责声明：本内容来自腾讯平台创作者，不代表腾讯新闻或腾讯网的观点和立场。