导语
"There are three areas where I want to go deeper today to show you the progress in each: Models, coding, and agents."
这不是日程表,这是谷歌交给 AI 下半场的答题卡。
而这三块拼图最令人振奋的地方在于:
模型:Gemini 3.5 Flash 一个 "Flash 级" 的小模型,把谷歌自己三个月前的旗舰 Gemini 3.1 Pro 在几乎所有基准上正面打穿;
编程:Antigravity 用 93 个子 Agent、12 小时、不到 1000 美元,从零造了一个能跑 Doom 的操作系统;
Agent:Search 直接进入"Search agents"时代——它不再只回答你,它开始替你做。
这一夜,AI 第一次大规模地从"对话框"走进了"日常事"。
一、模型层:3.5 Flash 把自家上一代 Pro 干翻了,Omni 让 AI 第一次会"改"视频
1. 数据先行:每分钟 190 亿 tokens,13 个产品月活破 10 亿
讲模型之前,皮查伊先甩了一组数据,定调"现在到底有多大":
谷歌每月处理 tokens:从 9.7 万亿涨到 3.2 千万亿; 每分钟处理:190 亿 tokens; 全球开发者:850 万; 月活破 10 亿的谷歌产品:13 个,其中 5 个超 30 亿; AI Overviews 月活:25 亿; AI Mode 上线一年,月活突破 10 亿; Capex 投入:从 2022 年的 310 亿美元,飙到 2026 年的 1800–1900 亿美元——四年 6 倍。
这是 Gemini 3.5 出场前的全部底气。
2. Gemini 3.5 Flash:今日全量上线,把自家上一代旗舰按在地上
接下来是模型层最大一块石头——Gemini 3.5 Flash 今日全量上线。
今天起在所有谷歌产品和 API 中全量开放; 同时成为 Gemini App 与 Google Search AI Mode 的默认模型——没错,你今天打开 AI Mode 搜的每一条,背后都已经是 3.5 Flash; Gemini 3.5 Pro 下个月跟上。
但真正让现场倒吸一口凉气的是数字:
速度:输出 289 tokens/秒,比 GPT-5.5、Claude Opus 4.7 快 4 倍以上; 价格:比同级前沿模型便宜超过一半; 性能:在几乎所有基准上,与自家三个月前的旗舰 Gemini 3.1 Pro 正面对标并实现反超。
最后这一条值得停下来再读一遍——这是一个 Flash 级模型,在主要 benchmark 上全面对标自家上一代 Pro。换算到外部世界,约等于:一辆刚出厂的"经济款",把自家三个月前的"性能旗舰"按在地上摩擦。
四组关键基准成绩:
| 76.2% | ||
| 1656 Elo | ||
| 83.6% | ||
| 84.2% |
更暴力的是它对企业账单的杀伤力——皮查伊原话:大客户若把 80% 的工作切到 3.5 Flash,一年能省下超过 10 亿美元的 API 成本。
这是谷歌今晚扔在桌上的第一张牌:"我用一个 Flash 级模型,把整个前沿模型市场的均衡价格区间,向下又拉了一档。"
3. Gemini Omni:AI 第一次会"改"一段已经拍好的视频
如果说 3.5 Flash 是模型层的"性价比王炸",那 Omni 就是模型层的"想象力天花板"。
Demis Hassabis 上台揭幕:Omni 是一个原生的视频生成与编辑模型家族,今晚发布的首款成员叫 Gemini Omni Flash,更强的 Omni Pro 不久后跟上。
它最炸的地方,不是从零生成视频——这事 Veo 早能做。
"Just like Nano Banana redefined image editing, Omni gives you a much more natural way to edit video with conversational language."
(正如 Nano Banana 重新定义了图片编辑,Omni 让你能用对话式语言、自然地编辑视频。)
—— Demis Hassabis
真正的跨越,是它能改一段已经存在的视频,而不破坏原有人物的表演。
你拍了一段 selfie,一句 prompt + 一张参考图,它能:把背景换掉、加上特效、塞进一个新角色——而你脸上的表情、肢体语言、说话节奏,纹丝不动。
这一步是从"生成"迈向"编辑"——而这一步,正是创作者真正在意的那一步。
发布会还顺手秀了一手原生音视频同步生成:画面、配乐、音效在同一次推理里出来,不再需要三个模型接力配菜。
首发渠道:Omni Flash 今日正式上线,同时接入 Gemini App、Google Flow 和 YouTube Shorts——其中 YouTube Shorts 用户可直接免费使用。to-C 的扩散速度,谷歌这次没省力气。
顺带一提,谷歌 AI 内容防伪水印 SynthID 自上线以来,已为 1000 亿张图像和视频、6 万年时长的音频打上水印——他们清楚 Omni 这种工具会带来什么。研究显示,人类只能正确识别约 25% 的高质量深伪视频,水印这件事不再是"可选项"。
二、编程层:Antigravity 2.0——一个能跑 Doom 的操作系统
如果说模型层是地基,那今晚最让开发者血压升高的一段,全部发生在编程板块。
主讲人是 Varun Mohan——前 Codeium / Windsurf 创始人 CEO,加入谷歌后操盘 Antigravity。他给 2.0 写下的定位只有一句:
1. 一组先扔出来的数据:Antigravity 内部已经"飞起来"了
光是 Antigravity 一个产品,谷歌内部处理 token 的速度——
从今年 3 月的 5000 亿/天,飙到现在的 3 万亿/天。
两个月,6 倍。 这是 Antigravity 在内部跑出来的真实加速度。
而开发者今天拿到的 Antigravity 里的 Flash,是经过专项优化的 12× 加速版——也就是 3.5 Flash 在同等任务上吞吐能再翻 12 倍。
2. Antigravity 2.0 给开发者的三件大事
全新独立桌面应用:抛开传统 IDE 的"编辑器+插件"思路,把 Agent 对话面板 / Agent 产物面板 / 多 Agent 编排面板 做成一等公民; CLI + SDK + 原生语音:接入 Gemini audio 模型,可以直接用嘴和 Antigravity 谈需求; Android、Firebase、AI Studio 全栈原生集成; 底层引擎:Gemini 3.5 Flash × Antigravity Agent Harness,自带 sub-agents、hooks、async 三大原语。
3. 王炸时刻:93 个子 Agent,12 小时,造了一个能跑 Doom 的操作系统
Varun 在台上点开了一个不可思议的实验记录——
| 93 个 | |
| 12 小时 | |
| 超 15,000 次 | |
| 26 亿 | |
| 不到 1000 美元 | |
| 一个能跑 Doom 的操作系统 |
用谷歌自己的话说——
现场演示更震惊:Varun 在自家 OS 里随手敲了个 sl(Linux 老 ls 输错梗),跳出一只小火车;接着试着跑 Doom——缺驱动;他随口让 Antigravity 自己去修——修好了,全场鼓掌。
一件以前需要一整支系统团队做半年的事。
Varun 给这件事下的定调,是今晚开发者圈最值得被钉在墙上的一句话:
Antigravity 2.0 今天起全球开放。
三、Agent 层:Spark + Search Agents,AI 走出对话框的两条路径
到模块三,皮查伊把这一年的 "agentic" 叙事钉死:
但 Agent 不是一个产品,而是两条铺设路径——
一条是 Gemini App 里的主控大脑 Spark; 一条是直接长在全球最大入口里的 Search Agents。
1. Gemini Spark:你的 24×7 数字管家
Spark 是 Gemini App 里新冒出来的彗星图标。它的定位非常直白:
翻译成人话:它是一台 7×24 小时不打烊、托管在谷歌云上的"你"。
关键设计:
UI 是 Chat / Agent 双 Tab——Chat 还是问答,Agent 才是派活; 跨端:网页 / 桌面 / Android & iPhone 实时同步;接下来还会铺到 邮件 + IM; 能跑定时任务("每周一 8 点把上周会议纪要整理给我"); 通过 MCP 协议,未来几周打通第三方工具; 数据视野:连接的 Google 应用 + 聊天记录 + 已登录网站 + Personal Intelligence 个人画像 + 实时位置; 下半年,Spark 将直接落地到 Chrome 里,成为 "agentic browser"——这就是去年传闻已久的 "Chrome Auto Browse" 叙事的真正归宿; 同期还会推出 Android Halo——手机上专门为 Agent 准备的"基地"。
节奏与价格:
本周:仅对 trusted testers 灰度; 下周:向美国 Google AI Ultra 订阅用户开 Beta; AI Ultra 订阅同步调整: 新增 $100/月 入门档——这是开通 Spark Beta 的最低门槛; 最高档 Ultra 计划从 200/月; 此外,Gemini App 同步改版(代号 Neural Expressive),计费模式改为按算力计费。
2. Search 的 25 年最大改版:进入 "Search Agents" 时代
接下来上台的是 Liz Reid(谷歌搜索负责人)。她甩出今晚 Agent 板块第二组震撼数据:
AI Mode 上线刚一年,月活突破 10 亿; AI Mode 查询数自上线以来每季度翻倍; 已升级到 Gemini 3.5——现在打开 AI Mode,你用的就是它。
然后她说出全文最值得划线的那句:
3.三件具体的事
(1) 全新的 AI 搜索框 —— 25 年来最大的一次搜索框升级。原生支持文本 / 图像 / 文件 / 视频混合输入,AI Overviews 与 AI Mode 之间无缝切换。
(2) Information Agents(信息智能体)—— 24×7 在后台替你"盯着"
它主动监控你交代过的事:
demo 1:监控生物科技板块"市盈率<15、正现金流、低负债"的股票,命中即推送; demo 2:租房——你随口讲一段需求,它持续在背后筛新房源; demo 3:心仪球鞋一发售即时预警。
预计的上线时间:今年夏天。
(3) Generative UI in Search —— Antigravity 直接被嵌进 Search 后端
这是今晚 Search 部分最反直觉的一段。
demo 1:问一个关于黑洞引力波的物理问题,Search 现场写出了一个交互式可视化 mini-app;
demo 2:Search 主动提议——"要不要给你做个周末家庭计划器?"它结合 Gmail / Photos / Calendar 里的家庭画像,实时排出周末两天的行程,能转发给老婆、能一键同步到全家共享日历。
预计上线时间:今年夏天免费向所有人开放。
4.顺带的一颗长期变量:UCP(Universal Commerce Protocol)
Search 章节末尾,Vidhya Srinivasan 抛出了一个野心更大的东西——UCP 通用商业协议:
谷歌 Shopping Graph 已收录 600 亿条商品,这是 UCP 一上来就能撑住的底盘。这一步如果跑成,"AI 替你购物"就不再是各家厂商各自的小作坊,而是整个互联网商业层的协议级重构。
四、把三块拼图咬合起来看:谷歌究竟在赌什么?
把今晚的三块板块叠在一起,会浮出一句异常清晰的判断:
模型 → Omni 让 AI 第一次能改一段已经拍好的视频; 编程 → Antigravity 用 1000 美元造了一个能跑 Doom 的操作系统; Agent → Spark 24×7 替你跑后台,Search 边搜索边替你下单。
OpenAI 的 Agent 平台、Anthropic 的 Conway、微软的 Agent 365 都在路上。但谷歌今晚交出的这份答卷,差异化只有一句话——
这场 Agent 决赛的胜负手,可能不在谁的模型 benchmark 高一两个点。
它在——谁能把 AI 真的铺到 10 亿人的日常里。
谷歌握着三个一般人一抬手就会用到的入口:Gemini App(Spark)+ Google Search(Search Agents)+ Antigravity(开发者)——这是一道别家短期内复制不出来的分发护城河。
至于另一面:当一个 24×7 的 Agent 拥有你的邮箱、相册、日历、位置和支付权限时,安全边界谁来守?谁来负责?——这是谷歌今晚没能给出完整答案的题,也是接下来一年所有大厂都绕不开的题。
五、写在最后
回头看皮查伊那句开场白——"Models, coding, and agents."——它其实不是日程表,是谷歌交给 AI 时代下半场的答案:
模型继续往前推(更便宜、更多模态、能编辑而不只是生成); 编程被 Agent 重写(一个人 + 一群子智能体 = 一个工程团队); Agent 借着搜索框和 App 入口,第一次真正走进了 10 亿人的日常。
你最期待哪一件事先发生在自己身上?——
☐ Spark 替你管收件箱和日程 ☐ Search Agent 替你抢球鞋 / 监控租房 / 盯股票 ☐ Antigravity 替你写下一个项目的代码
评论区聊聊。
一分钟视频速览