M2迅速飙升至HF榜No.3⬆️
今天,MiniMax发布并开源了他们的新一代旗舰模型:MiniMax M2
一款专注Max coding & Agentic workflows的Mini model,参数量只有230B(激活参数10B)。
在Artificial Analysis榜单上,M2取得了开源全球第一、闭源全球第四的成绩。
数据来自artificialanalysis.ai
现在,上agent.minimaxi.com已经可以体验,完全免费。API调用,也是免费。
至于何时收费?MiniMax只轻描淡写说了一句,“直到我们服务器撑不住为止”。
一手实测
真实体验,胜于榜单。
我也第一时间在Claude Code里进行了体验。个人感觉是,M2完全不输Claude 4.5、K2和GLM-4.6,甚至部分场景比他们还要强。下面,给大家看我的实测对比。
1)知识卡片
Prompt:总结这个网页(https://zhuanlan.zhihu.com/p/1966160013463626779),生成一个精美的知识卡片网页。这是一个简单的知识卡片网页的前端开发,考验模型的联网能力、文本总结能力,以及前端的审美能力。
我们来看一下GLM-4.6、Claude 4.5、M2三家的表现。
Claude 4.5说打不开知乎(美国模型打不开知乎??),但还是把网页原型给设计出来了。GLM-4.6也总结得不错。但,明显M2对内容的总结和页面设计都更胜一筹。
2)微旅程网站
Prompt:开发一个“微旅程”网站,每天推荐一张世界小众角落的照片+一段故事。先看三家对比。
M2和GLM-4.6都能调出真实的图片,图文内容一致。
有意思的是,M2还设计了很多的往期内容。
3)3D特效
Prompt:Create a 3D particle galaxy with swirling nebulas, dynamic lighting.先看对比。
现在,能跑出这个prompt的模型又多了一家(K2、GLM 4.6、Qwen3和M2),也是国产。不得不说,我们自己的模型是真的越来越好了。强如Claude来了,也是一团雪花。
4)旅行足迹
Prompt:使用Three.js和JavaScript构建一个网页,创建一个基于数组的 3D 世界,展示我去过的地方。点击 3D 地球上的标记将触发缩放动画效果,并打开带有照片的详细旅行信息。3D地球,三家都画出来了。
但要做到地图标记,只有GLM-4.6和M2。如果要对标记点进行详细介绍,则只有M2实现了这个功能。
5)电商网站
Prompt:设计一个“绒跃”电商网站,slogan“柔软开挂,跑无负担”,专注销售羊毛运动鞋:以“天然羊毛 + 城市机能”为核心卖点,整体视觉采用低饱和暖白、燕麦色与雾灰渐变,突出羊毛柔软质感。包含品牌介绍、商品列表、购物车等功能。这个需求稍微复杂了点,我们来看下三家对比。
三家对指令的遵循都还不错,我要求的卖点、主视觉和功能设计,这些都实现了。
如果非要挑更优的话,Claude 4.5确实更胜一筹。
6)情绪调酒器
Prompt:帮我做一个调酒模拟器网页,用户可以选择调酒材料、自己的心情以及想要的口味,就能创造一款专属饮品,体验调酒的乐趣。
整体来说,三家完成得都不错。
区别在于,M2和GLM-4.6在容器的交互设计上更用心一些。
比如M2,它从开始调酒到调酒结束一共设计了3个交互动画,就很酷。
7)更多case
测试中,我还跑了一些case,M2都完成得不错,而且速度也很快(大部分case在2分钟内完成)。
比如,这个颜色记忆小游戏。
Prompt:请实现一个颜色记忆游戏(类似 Simon Game)。四个不同颜色的按钮会依次闪烁(形成一个序列),玩家需在下一轮准确复现。每轮会增加一个颜色,难度逐渐上升。需实现错误提示、最高连击统计、音效模拟(可用 Web Audio API)。真的很好玩,我直接玩到了7级。
还有这个,反应力测试的小游戏,也很有趣。
Prompt:用 HTML/CSS/JS 实现一个“反应力测试小游戏”:画面上有一个小黑块随机出现,你需要用鼠标点击它,越快越好,系统会记录你的反应时间。连续10次后给出统计数据:平均反应时间、最快/最慢一次、反应偏差图表。界面简洁,响应迅速,可在手机端适配。
更厉害的是,M2还能做一些全栈开发。
Prompt:设计一个共享功德箱的网站, 鼠标点击+1点功德 , 保存到数据库。同时,配备一个管理员页面, 可以手动修改总功德数。它把前端页面、后端服务器、数据库和管理后台,都给我设计出来了。
关于实际效果,我给大家录了个视频。
整个体验下来,我觉得M2的编程能力绝对算得上全球第一梯队的水平,不输Claude 4.5、GLM-4.6和K2。
也难怪,MiniMax Agent网站已经把他们的基座模型全面切换为M2了,而并非那个“死贵死贵且中国人不得使用”的某海外模型。
打铁还需自身硬,MiniMax做到了“自主可控”。
一些干货
M2刚刚上线,我知道你一定有很多问题,我给大家整理了一些干货,看看对你有没有帮助。
1)免费入口
目前,MiniMax Agent和MiniMax开放平台都支持免费体验,“直到MiniMax平台服务器撑不住为止”——这是MiniMax CEO闫俊杰亲口说的。
MiniMax Agent
https://agent.minimaxi.com
MiniMax开放平台
https://platform.minimaxi.com/docs/guides/text-generation
2)关于M2
M2,是一个混合思考模型。总参数230B,激活参数10B。
在实际使用过程中,继续保留助手历史会话里的thinking过程。
模型输出时,会使用<think>...</think>格式来展示助手的思考内容。
使用模型时,必须保证历史内容以原始格式传回。请勿删除<think>...</think>部分,否则模型的性能会受到负面影响。
3)部署须知
M2模型已在HugingFace开源,推荐使用vLLM或SGLang部署。
模型下载:
https://huggingface.co/MiniMaxAI/MiniMax-M2
vLLM部署指引:
https://huggingface.co/MiniMaxAI/MiniMax-M2/blob/main/docs/vllm_deploy_guide_cn.md
SGLang部署指引:
https://huggingface.co/MiniMaxAI/MiniMax-M2/blob/main/docs/sglang_deploy_guide_cn.md
上面2个指引都是中文的,可以放心阅读。可见,MiniMax它是真的想教会你做自部署。
自部署,GPU显存需要>220GB,因为每1M上下文token需要240GB。
推荐配置:
96G x4 GPU:支持40万token的总上下文。
144G x8 GPU:支持长达300万token的总上下文。
推荐使用这个推理参数,可以获得最佳性能。
temperature=1.0, top_p = 0.95, top_k = 20
4)工具调用
M2支持工具调用,它会识别何时需要调用外部工具,然后以结构化格式输出调用参数。
比如,我们以天气查询工具调用举例,这是基于OpenAI SDK的Python脚本。
from openai import OpenAIimport jsonclient = OpenAI(base_url="http://localhost:8000/v1", api_key="dummy")def get_weather(location: str, unit: str):return f"Getting the weather for {location} in {unit}..."tool_functions = {"get_weather": get_weather}tools = [{"type": "function","function": {"name": "get_weather","description": "Get the current weather in a given location","parameters": {"type": "object","properties": {"location": {"type": "string", "description": "City and state, e.g., 'San Francisco, CA'"},"unit": {"type": "string", "enum": ["celsius", "fahrenheit"]}},"required": ["location", "unit"]}}}]response = client.chat.completions.create(model=client.models.list().data[0].id,messages=[{"role": "user", "content": "What's the weather like in San Francisco? use celsius."}],tools=tools,tool_choice="auto")print(response)tool_call = response.choices[0].message.tool_calls[0].functionprint(f"Function called: {tool_call.name}")print(f"Arguments: {tool_call.arguments}")print(f"Result: {get_weather(**json.loads(tool_call.arguments))}")
然后,会输出:
Function called: get_weatherArguments: {"location": "San Francisco, CA", "unit": "celsius"}Result: Getting the weather for San Francisco, CA in celsius...
更多的工具调用实操,大家可以前往官方指南查看。同样,也是全程中文。
工具调用指南:
https://huggingface.co/MiniMaxAI/MiniMax-M2/blob/main/docs/tool_calling_guide_cn.md
5)关于价格
M2模型的API,输入2.1元/百万 tokens,输出8.4元/百万tokens。
在国产里面,与K2、GLM大致相当,高于DeepSeek V3.2;在海外里面,则不到Claude的8%。
不过,目前是免费的,一直免费到11月7日。
也不分什么Air版、Pro版,直接就一个模型,全量免费。
而且,速度还很快,TPS(每秒输出Token数)超过100(还在提升中)。