问AI · 小米的全栈AI布局如何重塑其在Agent时代的竞争力?
模型的能力
万亿参数,高效架构:总参数量突破 1T(激活参数 42B),较前代 MiMo-V2-Flash 扩大约 3 倍。沿用前代 MiMo-V2-Flash 的创新 Hybrid Attention 机制,混合比例从 5:1 进一步提升至 7:1,在参数量大幅增长的同时依然维持了较高推理效率,并支持 1M 超长上下文。轻量 MTP (Multi Token Prediction) 层实现了高效的生成速度。
从 Chat 到 Agent:通过后训练阶段在更广泛的 Agent 任务场景进行 Scaling,模型能力已不再局限于“回答问题”或是“生成精美 Demo”,而是“完成任务”。我们致力于将其深度集成至生产力场景,使其成为驱动系统运转的“大脑”,持续交付具有真实世界影响力的结果。
超越榜单的实际体验:在各个衡量模型重要能力的基准测评中,MiMo-V2-Pro 均表现优异,Coding Agent、通用 Agent 和 Tool Use 与 Claude 4.5 Sonnet、GPT5.2、Gemini 3.0 Pro 处于同一梯队,展现了其领先的智能水平。我们坚持以“实际体感”为导向进行训练优化,始终关注模型在应用场景中的落地表现。