Gemini 3.0 疑似以代码名 lithiumflow(Pro 无搜索)和 orionmist(Pro 带搜索或 Flash)在 LM Arena 上线测试!
目前仅在 LM Arena 的实时对战中出现,还未进入公开排行榜。
我猜基本靠谱,毕竟已经箭在弦上,到了不得不发的时候了。(之前曝光是 10.22,又有人说要 delay 到 11 月)
先说怎么才能体验?
打开网址:https://web.lmarena.ai/
输入 prompt 让两个匿名模型 PK,等两个模型作答完之后,一定要选择哪个更好,就会看到模型名字,多试几次,直到翻牌子翻出来 lithiumflow 或者 OrionMist。
lithiumflow:是 Gemini 3.0 Pro 可能性最大。据已经体验测试的朋友说,在代码生成、视觉任务、复杂推理上表现出色。比如
orionmist: 有人说是带搜索版的 Gemini 3.0 Pro ,也有人不猜测为 Gemini 3.0 Flash(更轻量、快速变体)。在搜索增强任务中更强,但整体性能与 lithiumflow 相似。
这是目前网友放出来的测试效果。
模拟的 Mac 操作系统
生成一个机械花朵开合的 SVG,带有分层矢量动画
由 lithiumflow 生成的密室逃脱游戏
创建一辆 3D 汽车爆炸成碎片的 SVG
生成 xbox 的手柄控制器
生成近 500 行无 bug 代码 voxel pagoda 项目
3D 版的骑自行车的鹈鹕
据广大网友的初步测试,领先当前排行(如 Gemini 2.5 Pro),但用户担忧可能被“nerf”(性能调低)以避免过早泄露。
早前有 “oceanstone” 等代码名被猜测为 Gemini 3 Flash 测试,但 lithiumflow 和 orionmist 是最新且最一致的确认。
总体而言,这标志着 Gemini 3.0 进入最后测试阶段,性能跃升明显(特别是在 Pro 变体),但需等待官方基准以确认是否真正达到 AGI 级。