11月21日,小米宣布具身大模型MiMo-Embodied正式发布并全面开源。据小米方面介绍,该模型同步支持具身智能三大核心任务(可供性推理、任务规划、空间理解)与自动驾驶三大关键任务(环境感知、状态预测、驾驶规划),形成全场景智能支撑。
三大核心技术亮点
跨域能力覆盖:同步支持具身智能三大核心任务(可供性推理、任务规划、空间理解)与自动驾驶三大关键任务(环境感知、状态预测、驾驶规划),形成全场景智能支撑;
双向协同赋能:验证了室内交互能力与道路决策能力的知识转移协同效应,为跨场景智能融合提供了新的思路;
全链优化可靠:采用 “具身/自驾能力学习→ CoT 推理增强→RL 精细强化” 多阶段训练策略,有效提升模型在真实环境中的部署可靠性。
模型与代码现已开源
技术报告:https://arxiv.org/abs/2511.16518
开源代码:GitHub - XiaomiMiMo/MiMo-Embodied: MiMo-Embodied
MiMo-Embodied 模型:https://huggingface.co/XiaomiMiMo/MiMo-Embodied-7B