划重点
01理想汽车CEO李想在《2024理想AI Talk》中分享了对人工智能领域的深度思考,并公布了多项人工智能成果。
02理想将人工智能作为重要战略方向,一年超100亿研发投入,近一半投入在人工智能方面。
03通过端到端+VLM智能驾驶解决方案,理想已成功应用人工智能并取得最佳实践,预计2025年实现L3自动驾驶。
04除此之外,理想同学APP已上线,具备强大的知识问答能力和视觉感知能力,为用户带来更高效的智能生活体验。
05李想表示,理想有望成为全球领先的人工智能企业,只要所有中国企业不放弃,一切皆有可能。
以上内容由腾讯混元大模型生成,仅供参考
李想已经不想再做一名汽车企业CEO了。
这是李想阔别公众视野九个月之后,在《2024理想AI Talk》中带来的重磅消息。
难道李想不造车了?李想要退休了?都不是,李想要做的是人工智能企业CEO。在《2024理想AI Talk》中,李想分享了对人工智能领域的深度思考,并公布了多项人工智能成果。
重仓人工智能,是时候重新认识理想与李想了。
AI医疗、AI办公、AI画图,现在好像万物都能AI一把,理想竟然也开始跟风了?
其实不然,布局人工智能一直是理想的隐藏战略,只不过自2023年年初发布战略后,转为阳谋战略了。
其实,早在2022年9月,理想就已确定要把人工智能作为真正重要的一个方向,彼时ChatGPT还未发布。时隔两个月后的11月30日,ChatGPT才被正式发布,随后全球才刮起一股AI风潮。
在理想确定人工智能是未来的竞争关键后,便开始大笔砸钱,一年超100亿研发投入,有接近一半投在人工智能方面。因此,在成为人工智能企业的路上,理想没有光吆喝,而是实打实地“烧钱”研发。
理想要成为人工智能企业,李想本人的意志同样至关重要。
“做汽车之家,有我人生中最大的一个遗憾。”
最高市值曾接近千亿港元的汽车之家,在任何人看来都不应该有遗憾,但是李想却坦言:“选了一个非常垂直的领域,虽然你做得很好,但是某种程度你可能为了一棵树,错过了一个森林。”
所以在第三次创业的时候,李想要选择一个森林,绝对不只做一棵树了。因此理想的业务不仅限于造车和开发智驾,还布局了理想同学、智能商业、智能工业等领域。
将人工智能转为阳谋,这次,理想和李想有着更大的雄心壮志。其中,智驾是重要一环。
不少人认为只要把L2辅助驾驶的场景做得越多,总有一天能无限趋近于L3,甚至可能就能够做到L3。
但这不是理想的想法。理想认为L3或者有监督智能驾驶,并不是L2的延续,而是L4或者自动驾驶的先导程序。所以理想的研发思路有别于其他车企,是用人工智能的方式来做自动驾驶,从最本质思考人是怎么学会开车的。
于是理想行业首创了端到端+VLM智能驾驶解决方案,已经成功应用人工智能并取得最佳实践。从端到端开始,才是真正的开始用人工智能的方式来做自动驾驶。
端到端模型因为全部由一个模型来实现,中间没有任何规则,所以信息传递、计算、迭代速度将更高,能保证大部分场景下的高效率行驶,提供类似于老司机的驾驶方式。
VLM(视觉语言大模型)则可以像人类老司机一样思考,它既会看画面,又会用“语言”描述画面并进行推理思考,最后辅助端到端模型,解决安全、导航、法规和舒适等方面的自动驾驶业内难题。比如在学校路段、施工路段、潮汐车道、公交车道等极限场景下,端到端+VLM能实现灵活通行,让驾驶更安全、更轻松。
端到端+VLM双系统方案也展示出了优越性,不仅AI模型能力迭代速度是行业领先的,并且随着数据量的增长,性能也会随之提升。同时,用户使用高阶智驾的感受也会领先行业,理想获得的多个奖项就是力证。
比如理想智能驾驶的相关学术成果,陆续发表在了CVPR、ICCV、ECCV及CoRL等国际顶尖学术会议上,并在nuScenes等国际竞赛中斩获多个奖项。其中理想智能驾驶的DiVE(世界模型)及StreetGaussians(世界模型)发表在了ECCV 2024上,DriveVLM(快慢双系统)发表在了CoRL 2024上,获得行业的一致认可。
毫无疑问,理想已经成功站稳高阶智驾第一梯队。
理想智能驾驶研发副总裁郎咸朋表示:“按照现在的端到端+VLM这套体系,能力继续迭代的话,我们是有希望在2025年去实现L3的。”根据规划,理想高速城市全场景升级端到端+VLM,以及创新的AI推理可视化的交互,将在近期随OTA全量推送给所有的AD Max用户。
理想实现L3近在眼前。有了人工智能,汽车将不再只是单调的工具。
“汽车将从工业时代的交通工具,进化成为人工智能时代的空间机器人。”理想还将打破空间界限,让用户实现从车到家再到世界,理想同学或成为其中关键。
大家对理想同学应该都不陌生,它是理想的智能助手。但是和普通的车载助手又有所不同,理想同学基于理想自研的行业首个车载认知大模型Mind GPT打造而来。
从重在语言理解、生成、知识问答等能力的1.0大语言模型,再到具备自主性、能解决更多复杂问题的2.0语言智能体,目前理想同学已经升级为了最新一代Mind GPT-3o。
Mind GPT-3o是一款多模态端到端大模型,其响应速度能进入百毫秒级别,拥有在一个模型内完成从感知到认知再到表达的完整能力。得益于此,理想同学的记忆、规划、工具、表达能力得到全面提升。
比如理想同学能听会看,可感知动植物、汽车、画作等,知道周边建筑和地理信息;再比如理想同学能认识你和全家人,记住你们的偏好和要求,让出行用车更便捷;还比如,理想同学可以查限行、查日历、选美团餐厅,还能查询本地热门活动,让我们的生活更便利。
总而言之,有了Mind GPT-3o的赋能,理想同学能带来更高效的智能生活体验,这是理想为何自研大模型的一大原因。
此外,理想的目标是成为全球领先的人工智能企业,而大模型技术是AI的核心能力,关系到智能化产品体验的关键,因此自研大模型也能帮助理想在技术创新和用户体验上更具主动性和优势。
值得关注的是,理想全栈自研的Mind GPT大模型获得了业内的高度认可。
2024年,理想汽车人工智能团队在ACL,AAAI、ACM MM及ICASSP等国际顶尖学术会议发表论文10余篇;同年,理想人工智能获得8个国家级奖项,包含中国软件协会颁发“2024人工智能创新企业”称号、“第五届中国人工智能大赛A级证书”,并且理想还是中国首个获得AI智能座舱能力A级认证的企业。
换言之,理想同学已经是行业内最好用的车载智能助手。
有了人工智能大模型赋能后的理想同学,仅仅只搭载于车机上,无法发挥出它全部的实力,那么它是否可以去自主使用所有的设备、拥有所有的服务?
真正的人工智能理应如此,可以为用户提供跨设备的一致体验,所以理想同学走出汽车,迈向手机,12月27日,理想同学App已经上线。
理想同学APP拥有强大的知识问答能力,可以为我们解答汽车、出行、财经、科技等众多领域的问题,还具备强大的视觉感知能力,能够陪伴你和你的家人一起看世界。
比如一家人出门旅游时,可以在理想同学APP中询问当地的特色菜是什么。理想同学APP还可以解决小朋友天马行空的问题,比如电动车是怎么跑起来的,再比如拍照询问刚刚遇到的小昆虫是什么。
边看边学,边走边学,不止在车上、手机上,理想同学后续甚至可以装备在眼镜上。
“互联网实现了信息平权,人工智能开始帮助大家实现认知和能力的平权。我们通过人工智能将物理世界和数字世界进行融合,让有限的空间实现无限的延伸。”
而理想和李想所做的一切,初衷是为了用户。
“超越用户的需求,创造让我们自豪的产品和服务。”理想的价值观始终把用户价值放在第一位,不只要满足用户需求,更要超越用户需求。通过人工智能,理想可以完美结合用户的需求,最终创造移动的家,创造幸福的家。
在通往“幸福的家”的过程中,理想将经过AGI(通用人工智能)的三个阶段:
第一个阶段为“增强我的能力”,将帮助用户提高效率,比如L3的自动驾驶,可以让用户出行更为方便。不过受限于能力,此时的人工智能还只是一个辅助,决策权仍在用户手中。
第二个阶段为“成为我的助手”,可以独立完成一个或多个任务,并对结果承担责任。比如用户可以向一辆L4的车发布接孩子的任务,这时车辆可以到学校帮用户接孩子,并进行面部识别、打开门让孩子上车。
第三个阶段为“硅基家人”,此时人工智能相当于一个家庭成员,甚至是家庭重要的组织者,它了解你和你的孩子、朋友,可以自主去做一些事情。
李想表示:“我自己最兴奋的一件事情是我认为,我和我们的团队能够在有生之年实现第三个阶段。”
“北京车和家信息技术有限公司”的运营公司名称始终没变过,理想还是那个理想,但理想又不再是那个理想,随着人工智能企业这层面纱被揭开,“车和家”的定义通过AI的赋能更加超前。
李想还是那个李想,依旧金句频出,但李想又不再是此前的李想,更有能力实现更大的野心了。
中国企业能成为全球领先的AI企业吗?李想表示:“我觉得一切都有可能,只要所有的中国企业不放弃,一切皆有可能。”
要成为全球领先的人工智能企业,理想同样皆有可能。