我们被“前端友好”的AI骗了多久?| 实测MiniMax M2.1

大家好,我是爱折腾“歪脖扣定”的冷逸。

马上圣诞节到了,先给大家表演一个隔空抓娃娃。

需要这个HTML的朋友,可以在后台私信【抓娃娃】领取。只要电脑有摄像头,用浏览器打开就能玩。

怎么做的呢?

用MiniMax最新的M2.1模型+Claude Code研发完成,提示词我放在这里了。

创建一个基于Web摄像头的圣诞风的3D抓娃娃机游戏“沃垠AI抓娃机”。只输出一个单HTML文件,集成HTML、CSS和JavaScript。使用Three.is创建3D场景,使用MediaPipe Hands实现手势控制,并基于Web Audio API给游戏添加音效。

我还用它做了一台鼓机模拟器(记得一定要戴🎧听)。

提示词:使用Web Audio API创建一个16步的鼓机模拟器,提供前卫、时尚的电子音乐体验,只输出一个单HTML文件,集成合成鼓声、实时Glitch音效等,中文界面。

我较早就参加了M2.1的内测,简单说下我的使用感受。

  • 1、思考链和回复都很短,模型速度非常快。普通的Demo开发,不到一分钟搞定。

  • 2、专门针对Claude Code、Cline、Kilo Code、Roo Code等编程工具做了优化,在CLI和IDE里用起来很爽

  • 3、不限于Web端的提升,APP端的审美也得到大幅提升,而且具备全栈开发能力。

  • 4、能写Python,但同时也擅长Jave、Golang等后端。特别是后端这块,这次提升挺明显的。

  • 5、工具调用有所增强,上下文管理进一步优化。

对比M2,M2.1的提升非常明显。在软件工程的核心榜单上,M2.1的表现超过了Claude Sonnet 4.5和Gemini 3 Pro。

图片

为了衡量模型“从0到1”的全栈能力,MiniMax还专门开源了一个基准榜单。

图片

VIBE:https://huggingface.co/datasets/MiniMaxAI/VIBE

这个榜单叫VIBE(Visual & Interactive Benchmark for Execution in Application Development),涵盖了Web、仿真 (Simulation)、Android、iOS及后端 (Backend) 五大核心子集,用于评估模型在真实运行环境下的交互逻辑和视觉审美。

在这个榜单上,M2.1拿到了88.6的高分,表现接近Claude Opus 4.5。

图片
图片

更多实测

1)前端测试

我有一份沃垠AI公众号的阅读数据,我让它帮我设计一份数据面板。

提示词:基于这份数据{「沃垠AI」公众号数据.xlsx},开发一个实时数据监控面板,黑客帝国风格。

M2.1用Python语言完成了开发,并自动生成了数据库,对高频数据流进行动态捕捉和渲染。

图片

这效果,很炫酷。

再看一个case,这是我经常在用的信息图Prompt,之前我基本只用Gemini 3,这次看看M2.1表现如何。

提炼下面内容的核心关键点,创建一个HTML网页。
文字内容:
{
我也较早就参加了MiniMax M2.1的内测,说说我的使用感受。
1、思考链和回复都很短,模型速度非常快。普通的Demo开发,不到一分钟就能完成。
2、针对Claude Code、Cline、Kilo Code、Roo Code等工具做了专项优化,在CLI和IDE里用起来很爽。
3、前端优化不限于Web端,APP端的审美也得到大幅提升。
4、能写Python,但同时也擅长Jave、Golang等后端语言。特别是后端的这块,这次提升挺明显的。
}
具体要求如下:
1.视觉设计:采用{Magazine Layout}风格布局,{深色}主题色,营造现代高端氛围。
2.字体与排版:
·使用超大字体或数字突出核心要点,中文采用大号粗体,强调视觉冲击力。
·英文使用小号字体作为点缀,与中文形成比例反差,提升设计层次感。
3视觉元素:
·融入超大视觉元素(如标题、背景图或装饰)以突出重点,与小型元素形成强烈对比。
·使用简洁的勾线风格图形作为数据可视化或配图元素,保持现代感和清晰度。
4.色彩与效果:运用高亮色(单色透明度渐变)营造科技感,每种高亮色独立使用,避免不同高亮色之间的渐变混杂。
5.技术要求:引入专业图标库(如Font Awesome或Material Icons,通过CDN加载),避免使用emoji作为主要图标。
6.内容要求:提炼内容关键要点,不忽略重要细节。

这效果真的不错啊,至少前端审美这块完全可以媲美Gemini 3。

图片

2)3D测试

这是x上(@Ryan Lazuka)的一个提示词。

提示词:Create a single HTML file containing a fully functional 3D Rubik's Cube simulation using Three.js (via CDN). The cube must be able to automatically solve itself. 
译文:创建一个HTML文件,其中使用Three.js(通过CDN方式引入)来实现一个功能完备的3D魔方模拟程序。该魔方必须能够自动完成自己的“解谜”过程。

实话说,这对于大模型来说挺难的。

因为,它不仅要用Three.js语言画出3D魔方的模型,还要能够记录打乱的步骤并逆序还原,很考验模型的逻辑能力。

这个case我用M2.1生成,大概迭代了3次。

图片

最终出来的效果,非常牛逼。

图片

同样的3D case,还有粒子特效这个。熟悉我们的朋友都知道,这差不多是我们的老演员了。

Create a 3D particle galaxy with swirling nebulas, dynamic lighting.

我用M2.1随手生成了个,没想到已经进化了这么多。

图片

这个粒子特效的数量、色彩和光影细节,都比M2提升了很多很多动图里看到图片糊了,那不是模型的问题啊,那是图片被压缩了

动图看不出效果,我给大家放几张静态图。

图片
图片
图片

3)APP开发

除了web端,M2.1这次在APP端的开发能力提升也挺明显的。

先看一个UI案例。

为小沃APP设计一套UI界面,要有详细的交互UI和功能,小沃是一款机器狗,小沃APP是这款机器狗服务客户的智能助手。

其实,我是只想看看UI的,没想到它真的给我开发了一个APP,整整500多个文件……不知道明天,我的API账单还扛得住不

图片

来看看这个APP长啥样吧。

可以看到,M2.1对APP整体的设计理解和美学表达,都还挺靠谱的。

再来看一个安卓端的手机游戏(by官方)。

用Kotlin语言开发一款重力感应模拟器,利用陀螺仪传感器实现重力操控体验,并设计有巧妙的视觉彩蛋。

可以看到,UI的过渡和碰撞特效非常自然,而且巧妙的呈现了“MERRY XMAS MiniMax M2.1”。

目前,很多coding模型都在拼命表现自己web端很强,但移动端的开发能力就只字不提。

其实,移动端才是研发的大头。很高兴,今天见到有模型开始在Android、iOS开发上发力了。

而且,M2.1是具备APP开发从0到1再到100的能力的(比如我前面那个case)。这一点,真的牛逼。

4)后端开发

过去,很多模型在宣发时,都强调自己前端很强、UI很酷。

但这能代表coding能力吗?未必。

前端很重要,但它不是全部。唯有前后端一起进化,才能做出真正生产级的产品。

M2.1这次着重在后端上做了提升,从Java后端到Golang服务,到C++,到客户端、SDK……各个开发环节都有所加强。不再聚焦前端demo,而是关注整个开发环节。

这是第一次有coding模型,开始理解不同的技术岗位是怎么写代码的,去帮助各种开发环节解决编码问题。

给大家看几个例子。

帮我写一个跨平台C++文件读写工具。

图片

让它写一个用户鉴权模块,一看就是Java老手。

图片

用C++和GLSL渲染图像,精准还原水晶球的物理折射、雪人建模以及雪地特效。

我的体验感觉是,M2.1让AI Coding开始从“单文件”向“工程感”进发。

它的后端能力肯定不是最强的,也还有很多需要优化的地方。

但我们终于在M2.1上看到,Coding模型开始从“前端友好”向“后端友好”进化,而不再是让demo写法当成生产代码。

终于,有一个正常的coding模型把大家拉回正轨,开始解决真实世界中的复杂任务。

图片

怎么使用

APIMiniMax开放平台已经上线,模型名MiniMax-M2.1,支持OpenAI&Anthropic接口。

https://platform.minimaxi.com/docs/guides/text-generation

Coding Plan同时,M2.1已加入Coding Plan,加量不加价。

https://platform.minimaxi.com/subscribe/coding-plan

图片

开源几天后,模型将开源(目前在对齐测试中)。

https://huggingface.co/MiniMaxAI/MiniMax-M2.1