大家好,我是爱折腾“歪脖扣定”的冷逸。
马上圣诞节到了,先给大家表演一个隔空抓娃娃。
需要这个HTML的朋友,可以在后台私信【抓娃娃】领取。只要电脑有摄像头,用浏览器打开就能玩。
怎么做的呢?
用MiniMax最新的M2.1模型+Claude Code研发完成,提示词我放在这里了。
创建一个基于Web摄像头的圣诞风的3D抓娃娃机游戏“沃垠AI抓娃机”。只输出一个单HTML文件,集成HTML、CSS和JavaScript。使用Three.is创建3D场景,使用MediaPipe Hands实现手势控制,并基于Web Audio API给游戏添加音效。我还用它做了一台鼓机模拟器(记得一定要戴🎧听)。
提示词:使用Web Audio API创建一个16步的鼓机模拟器,提供前卫、时尚的电子音乐体验,只输出一个单HTML文件,集成合成鼓声、实时Glitch音效等,中文界面。
我较早就参加了M2.1的内测,简单说下我的使用感受。
1、思考链和回复都很短,模型速度非常快。普通的Demo开发,不到一分钟搞定。
2、专门针对Claude Code、Cline、Kilo Code、Roo Code等编程工具做了优化,在CLI和IDE里用起来很爽。
3、不限于Web端的提升,APP端的审美也得到大幅提升,而且具备全栈开发能力。
4、能写Python,但同时也擅长Jave、Golang等后端。特别是后端这块,这次提升挺明显的。
5、工具调用有所增强,上下文管理进一步优化。
对比M2,M2.1的提升非常明显。在软件工程的核心榜单上,M2.1的表现超过了Claude Sonnet 4.5和Gemini 3 Pro。
为了衡量模型“从0到1”的全栈能力,MiniMax还专门开源了一个基准榜单。
VIBE:https://huggingface.co/datasets/MiniMaxAI/VIBE
这个榜单叫VIBE(Visual & Interactive Benchmark for Execution in Application Development),涵盖了Web、仿真 (Simulation)、Android、iOS及后端 (Backend) 五大核心子集,用于评估模型在真实运行环境下的交互逻辑和视觉审美。
在这个榜单上,M2.1拿到了88.6的高分,表现接近Claude Opus 4.5。
更多实测
1)前端测试
我有一份沃垠AI公众号的阅读数据,我让它帮我设计一份数据面板。
提示词:基于这份数据{「沃垠AI」公众号数据.xlsx},开发一个实时数据监控面板,黑客帝国风格。M2.1用Python语言完成了开发,并自动生成了数据库,对高频数据流进行动态捕捉和渲染。
这效果,很炫酷。
再看一个case,这是我经常在用的信息图Prompt,之前我基本只用Gemini 3,这次看看M2.1表现如何。
提炼下面内容的核心关键点,创建一个HTML网页。
文字内容:
{
我也较早就参加了MiniMax M2.1的内测,说说我的使用感受。
1、思考链和回复都很短,模型速度非常快。普通的Demo开发,不到一分钟就能完成。
2、针对Claude Code、Cline、Kilo Code、Roo Code等工具做了专项优化,在CLI和IDE里用起来很爽。
3、前端优化不限于Web端,APP端的审美也得到大幅提升。
4、能写Python,但同时也擅长Jave、Golang等后端语言。特别是后端的这块,这次提升挺明显的。
}
具体要求如下:
1.视觉设计:采用{Magazine Layout}风格布局,{深色}主题色,营造现代高端氛围。
2.字体与排版:
·使用超大字体或数字突出核心要点,中文采用大号粗体,强调视觉冲击力。
·英文使用小号字体作为点缀,与中文形成比例反差,提升设计层次感。
3视觉元素:
·融入超大视觉元素(如标题、背景图或装饰)以突出重点,与小型元素形成强烈对比。
·使用简洁的勾线风格图形作为数据可视化或配图元素,保持现代感和清晰度。
4.色彩与效果:运用高亮色(单色透明度渐变)营造科技感,每种高亮色独立使用,避免不同高亮色之间的渐变混杂。
5.技术要求:引入专业图标库(如Font Awesome或Material Icons,通过CDN加载),避免使用emoji作为主要图标。
6.内容要求:提炼内容关键要点,不忽略重要细节。这效果真的不错啊,至少前端审美这块完全可以媲美Gemini 3。
2)3D测试
这是x上(@Ryan Lazuka)的一个提示词。
提示词:Create a single HTML file containing a fully functional 3D Rubik's Cube simulation using Three.js (via CDN). The cube must be able to automatically solve itself.
译文:创建一个HTML文件,其中使用Three.js(通过CDN方式引入)来实现一个功能完备的3D魔方模拟程序。该魔方必须能够自动完成自己的“解谜”过程。实话说,这对于大模型来说挺难的。
因为,它不仅要用Three.js语言画出3D魔方的模型,还要能够记录打乱的步骤并逆序还原,很考验模型的逻辑能力。
这个case我用M2.1生成,大概迭代了3次。
最终出来的效果,非常牛逼。
同样的3D case,还有粒子特效这个。熟悉我们的朋友都知道,这差不多是我们的老演员了。
Create a 3D particle galaxy with swirling nebulas, dynamic lighting.我用M2.1随手生成了个,没想到已经进化了这么多。
这个粒子特效的数量、色彩和光影细节,都比M2提升了很多很多(动图里看到图片糊了,那不是模型的问题啊,那是图片被压缩了)。
动图看不出效果,我给大家放几张静态图。
3)APP开发
除了web端,M2.1这次在APP端的开发能力提升也挺明显的。
先看一个UI案例。
为小沃APP设计一套UI界面,要有详细的交互UI和功能,小沃是一款机器狗,小沃APP是这款机器狗服务客户的智能助手。其实,我是只想看看UI的,没想到它真的给我开发了一个APP,整整500多个文件……不知道明天,我的API账单还扛得住不。
来看看这个APP长啥样吧。
可以看到,M2.1对APP整体的设计理解和美学表达,都还挺靠谱的。
再来看一个安卓端的手机游戏(by官方)。
用Kotlin语言开发一款重力感应模拟器,利用陀螺仪传感器实现重力操控体验,并设计有巧妙的视觉彩蛋。可以看到,UI的过渡和碰撞特效非常自然,而且巧妙的呈现了“MERRY XMAS MiniMax M2.1”。
目前,很多coding模型都在拼命表现自己web端很强,但移动端的开发能力就只字不提。
其实,移动端才是研发的大头。很高兴,今天见到有模型开始在Android、iOS开发上发力了。
而且,M2.1是具备APP开发从0到1再到100的能力的(比如我前面那个case)。这一点,真的牛逼。
4)后端开发
过去,很多模型在宣发时,都强调自己前端很强、UI很酷。
但这能代表coding能力吗?未必。
前端很重要,但它不是全部。唯有前后端一起进化,才能做出真正生产级的产品。
M2.1这次着重在后端上做了提升,从Java后端到Golang服务,到C++,到客户端、SDK……各个开发环节都有所加强。不再聚焦前端demo,而是关注整个开发环节。
这是第一次有coding模型,开始理解不同的技术岗位是怎么写代码的,去帮助各种开发环节解决编码问题。
给大家看几个例子。
帮我写一个跨平台C++文件读写工具。
让它写一个用户鉴权模块,一看就是Java老手。
用C++和GLSL渲染图像,精准还原水晶球的物理折射、雪人建模以及雪地特效。
我的体验感觉是,M2.1让AI Coding开始从“单文件”向“工程感”进发。
它的后端能力肯定不是最强的,也还有很多需要优化的地方。
但我们终于在M2.1上看到,Coding模型开始从“前端友好”向“后端友好”进化,而不再是让demo写法当成生产代码。
终于,有一个正常的coding模型把大家拉回正轨,开始解决真实世界中的复杂任务。
怎么使用
API:MiniMax开放平台已经上线,模型名MiniMax-M2.1,支持OpenAI&Anthropic接口。
https://platform.minimaxi.com/docs/guides/text-generation
Coding Plan:同时,M2.1已加入Coding Plan,加量不加价。
https://platform.minimaxi.com/subscribe/coding-plan
开源:几天后,模型将开源(目前在对齐测试中)。
https://huggingface.co/MiniMaxAI/MiniMax-M2.1