我们被“前端友好”的AI骗了多久？| 实测MiniMax M2.1

沃垠AI

2025-12-24 10:00发布于四川科技领域创作者

大家好，我是爱折腾“歪脖扣定”的冷逸。

马上圣诞节到了，先给大家表演一个隔空抓娃娃。

需要这个HTML的朋友，可以在后台私信【抓娃娃】领取。只要电脑有摄像头，用浏览器打开就能玩。

怎么做的呢？

用MiniMax最新的M2.1模型+Claude Code研发完成，提示词我放在这里了。

创建一个基于Web摄像头的圣诞风的3D抓娃娃机游戏“沃垠AI抓娃机”。只输出一个单HTML文件，集成HTML、CSS和JavaScript。使用Three.is创建3D场景，使用MediaPipe Hands实现手势控制，并基于Web Audio API给游戏添加音效。

我还用它做了一台鼓机模拟器（记得一定要戴🎧听）。

提示词：使用Web Audio API创建一个16步的鼓机模拟器，提供前卫、时尚的电子音乐体验，只输出一个单HTML文件，集成合成鼓声、实时Glitch音效等，中文界面。

我较早就参加了M2.1的内测，简单说下我的使用感受。

1、思考链和回复都很短，模型速度非常快。普通的Demo开发，不到一分钟搞定。
2、专门针对Claude Code、Cline、Kilo Code、Roo Code等编程工具做了优化，在CLI和IDE里用起来很爽。
3、不限于Web端的提升，APP端的审美也得到大幅提升，而且具备全栈开发能力。
4、能写Python，但同时也擅长Jave、Golang等后端。特别是后端这块，这次提升挺明显的。
5、工具调用有所增强，上下文管理进一步优化。

对比M2，M2.1的提升非常明显。在软件工程的核心榜单上，M2.1的表现超过了Claude Sonnet 4.5和Gemini 3 Pro。

为了衡量模型“从0到1”的全栈能力，MiniMax还专门开源了一个基准榜单。

VIBE：https://huggingface.co/datasets/MiniMaxAI/VIBE

这个榜单叫VIBE(Visual & Interactive Benchmark for Execution in Application Development)，涵盖了Web、仿真 (Simulation)、Android、iOS及后端 (Backend) 五大核心子集，用于评估模型在真实运行环境下的交互逻辑和视觉审美。

在这个榜单上，M2.1拿到了88.6的高分，表现接近Claude Opus 4.5。

更多实测

1）前端测试

我有一份沃垠AI公众号的阅读数据，我让它帮我设计一份数据面板。

提示词：基于这份数据{「沃垠AI」公众号数据.xlsx}，开发一个实时数据监控面板，黑客帝国风格。

M2.1用Python语言完成了开发，并自动生成了数据库，对高频数据流进行动态捕捉和渲染。

这效果，很炫酷。

再看一个case，这是我经常在用的信息图Prompt，之前我基本只用Gemini 3，这次看看M2.1表现如何。

提炼下面内容的核心关键点，创建一个HTML网页。
文字内容：
{
我也较早就参加了MiniMax M2.1的内测，说说我的使用感受。
1、思考链和回复都很短，模型速度非常快。普通的Demo开发，不到一分钟就能完成。
2、针对Claude Code、Cline、Kilo Code、Roo Code等工具做了专项优化，在CLI和IDE里用起来很爽。
3、前端优化不限于Web端，APP端的审美也得到大幅提升。
4、能写Python，但同时也擅长Jave、Golang等后端语言。特别是后端的这块，这次提升挺明显的。
}
具体要求如下：
1.视觉设计：采用{Magazine Layout}风格布局，{深色}主题色，营造现代高端氛围。
2.字体与排版：
·使用超大字体或数字突出核心要点，中文采用大号粗体，强调视觉冲击力。
·英文使用小号字体作为点缀，与中文形成比例反差，提升设计层次感。
3视觉元素：
·融入超大视觉元素（如标题、背景图或装饰）以突出重点，与小型元素形成强烈对比。
·使用简洁的勾线风格图形作为数据可视化或配图元素，保持现代感和清晰度。
4.色彩与效果：运用高亮色（单色透明度渐变）营造科技感，每种高亮色独立使用，避免不同高亮色之间的渐变混杂。
5.技术要求：引入专业图标库（如Font Awesome或Material Icons，通过CDN加载），避免使用emoji作为主要图标。
6.内容要求：提炼内容关键要点，不忽略重要细节。

这效果真的不错啊，至少前端审美这块完全可以媲美Gemini 3。

2）3D测试

这是x上（@Ryan Lazuka）的一个提示词。

提示词：Create a single HTML file containing a fully functional 3D Rubik's Cube simulation using Three.js (via CDN). The cube must be able to automatically solve itself. 
译文：创建一个HTML文件，其中使用Three.js（通过CDN方式引入）来实现一个功能完备的3D魔方模拟程序。该魔方必须能够自动完成自己的“解谜”过程。

实话说，这对于大模型来说挺难的。

因为，它不仅要用Three.js语言画出3D魔方的模型，还要能够记录打乱的步骤并逆序还原，很考验模型的逻辑能力。

这个case我用M2.1生成，大概迭代了3次。

最终出来的效果，非常牛逼。

同样的3D case，还有粒子特效这个。熟悉我们的朋友都知道，这差不多是我们的老演员了。

Create a 3D particle galaxy with swirling nebulas, dynamic lighting.

我用M2.1随手生成了个，没想到已经进化了这么多。

这个粒子特效的数量、色彩和光影细节，都比M2提升了很多很多（动图里看到图片糊了，那不是模型的问题啊，那是图片被压缩了）。

动图看不出效果，我给大家放几张静态图。

3）APP开发

除了web端，M2.1这次在APP端的开发能力提升也挺明显的。

先看一个UI案例。

为小沃APP设计一套UI界面，要有详细的交互UI和功能，小沃是一款机器狗，小沃APP是这款机器狗服务客户的智能助手。

其实，我是只想看看UI的，没想到它真的给我开发了一个APP，整整500多个文件……不知道明天，我的API账单还扛得住不。

来看看这个APP长啥样吧。

可以看到，M2.1对APP整体的设计理解和美学表达，都还挺靠谱的。

再来看一个安卓端的手机游戏（by官方）。

用Kotlin语言开发一款重力感应模拟器，利用陀螺仪传感器实现重力操控体验，并设计有巧妙的视觉彩蛋。

可以看到，UI的过渡和碰撞特效非常自然，而且巧妙的呈现了“MERRY XMAS MiniMax M2.1”。

目前，很多coding模型都在拼命表现自己web端很强，但移动端的开发能力就只字不提。

其实，移动端才是研发的大头。很高兴，今天见到有模型开始在Android、iOS开发上发力了。

而且，M2.1是具备APP开发从0到1再到100的能力的（比如我前面那个case）。这一点，真的牛逼。

4）后端开发

过去，很多模型在宣发时，都强调自己前端很强、UI很酷。

但这能代表coding能力吗？未必。

前端很重要，但它不是全部。唯有前后端一起进化，才能做出真正生产级的产品。

M2.1这次着重在后端上做了提升，从Java后端到Golang服务，到C++，到客户端、SDK……各个开发环节都有所加强。不再聚焦前端demo，而是关注整个开发环节。

这是第一次有coding模型，开始理解不同的技术岗位是怎么写代码的，去帮助各种开发环节解决编码问题。

给大家看几个例子。

帮我写一个跨平台C++文件读写工具。

让它写一个用户鉴权模块，一看就是Java老手。

用C++和GLSL渲染图像，精准还原水晶球的物理折射、雪人建模以及雪地特效。

我的体验感觉是，M2.1让AI Coding开始从“单文件”向“工程感”进发。

它的后端能力肯定不是最强的，也还有很多需要优化的地方。

但我们终于在M2.1上看到，Coding模型开始从“前端友好”向“后端友好”进化，而不再是让demo写法当成生产代码。

终于，有一个正常的coding模型把大家拉回正轨，开始解决真实世界中的复杂任务。

怎么使用

API：MiniMax开放平台已经上线，模型名MiniMax-M2.1，支持OpenAI&Anthropic接口。

https://platform.minimaxi.com/docs/guides/text-generation

Coding Plan：同时，M2.1已加入Coding Plan，加量不加价。

https://platform.minimaxi.com/subscribe/coding-plan

开源：几天后，模型将开源（目前在对齐测试中）。

https://huggingface.co/MiniMaxAI/MiniMax-M2.1