+关注

手机看

微信扫一扫，随时随地看

细数Google最近迭代的5大AI功能，OpenAI要坐不住了！

AI先锋官官方

2025-03-20 08:25发布于北京

+关注

作者｜子川

来源｜AI先锋官

Google这波连着串的更新，太爽了！

就在昨天，Gemini推出了它们的Canvas功能！

不单单可以生成可视化网页，而且还能直接在画布上修改文章的内容，简直就是Claude Artifacts和ChatGPT的Canvas的结合体。

主要的功能有俩：文档编辑和代码实时预览功能。

Gemini Canvas的文档编辑功能，简直就是ChatGPT Canvas的翻版。

用户可以实时编辑文档，Gemini 提供即时反馈和建议，可选中任意段落，让Gemini帮你修改语气（更简洁、专业或口语化）、调整长度或格式。·

比如，让它生成一篇鲁迅风格的作品，并选中其中一段句子，提出修改建议：增加更多的细节。

00:00

倍速

3.0X

2.0X

1.5X

1.25X

1.0X

0.75X

0.5X

语言

多音轨

静音播放中，点击恢复音量

你可以刷新试试

视频信息

1.33.6

播放信息上传日志

视频ID

VID

播放流水

Flowid

播放内核

Kernel

显示器信息

Res

帧数

缓冲健康度

网络活动

net

视频分辨率

编码

Codec

mystery

按住画面移动小窗

除了和ChatGPT一样的Canvas功能之外，Gemini甚至更进一步。

可以直接在 Gemini上体验Claude的Artifacts功能。

支持多种编程语言，包括 Python、JavaScript 等，无论你是想开发 Web 应用、编写脚本，还是创建交互式体验，Gemini Canvas 都能满足你的需求。

重要的是实时迭代，用户可以要求 Gemini 修改代码，例如添加输入字段或按钮，并立即查看更新后的预览。

它的效果到底如何，我们来实际测试一下。

先来一个简单，让它生成可交互的五子棋小游戏，5秒不到，刷刷刷，一个简单的五子棋的代码就写出来了，甚至还可以和朋友在这个页面直接来上一局。

00:00

倍速

3.0X

2.0X

1.5X

1.25X

1.0X

0.75X

0.5X

语言

多音轨

静音播放中，点击恢复音量

你可以刷新试试

视频信息

1.33.6

播放信息上传日志

视频ID

VID

播放流水

Flowid

播放内核

Kernel

显示器信息

Res

帧数

缓冲健康度

网络活动

net

视频分辨率

编码

Codec

mystery

按住画面移动小窗

如果你觉得黑白两色的棋子不好看，还可以提出要求让Gemini进行修改。

也能生成产品的原型图。比如让告诉:我需要设计一个旅游App，帮我生成首页、功能页面、登录页的产品原型图。

00:00

倍速

3.0X

2.0X

1.5X

1.25X

1.0X

0.75X

0.5X

语言

多音轨

静音播放中，点击恢复音量

你可以刷新试试

视频信息

1.33.6

播放信息上传日志

视频ID

VID

播放流水

Flowid

播放内核

Kernel

显示器信息

Res

帧数

缓冲健康度

网络活动

net

视频分辨率

编码

Codec

mystery

按住画面移动小窗

也能用它生成此前大火的“一个小球在六边形框中跳动”的可视化页面。

00:00

倍速

3.0X

2.0X

1.5X

1.25X

1.0X

0.75X

0.5X

语言

多音轨

静音播放中，点击恢复音量

你可以刷新试试

视频信息

1.33.6

播放信息上传日志

视频ID

VID

播放流水

Flowid

播放内核

Kernel

显示器信息

Res

帧数

缓冲健康度

网络活动

net

视频分辨率

编码

Codec

mystery

按住画面移动小窗

同时，Gemini Canvas还支持协作共享，用户可以和他人实时协作编辑文档或代码，非常适合团队之间的合作。

这一周多时间里，Google动作不断，各种功能层出不穷，没有任何套路，开箱即用，重点还都免费。

下面我们来盘点最近Google上新的功能。

根据你搜索记录提供帮助功能

这个功能主要是通过整合用户Google搜索的历史数据，结合Gemini 2.0 Flash Thinking Experimental模型，实现了更精准的智能响应。

比如询问旅行建议时，系统会自动关联近期你使用Google搜索的景点、酒店或机票信息，生成结合个人偏好的行程方案。

换句话说，搜的越多，你的Gemini就越懂你。

Deep Research底层模型更新

终于！将Deep Research功能的底座换成了Gemini 2.0 Flash Thinking！

Deep Research的底层模型是Gemini 1.5 Pro，不过上线，就遭到群嘲模式，太不好用了。

而现在更换到Gemini 2.0 Flash Thinking模型，质量明显有了质的飞跃，给大家来直观感受一下。

提示词：搜索腾讯近5年的财报，并预测明年5月份的股票会是多少！

它首先会收集腾讯近五年的财报信息，并分析影响腾讯控股股票价格的因素，最后再进行预测。

跟OpenAI的Deep Research的不同是，他会给你把框架和节奏拆完，让你清晰的看到后面它会执行哪些步骤，你点击开始研究之后，他才会去整个互联网上去搜索。

动动嘴，就能在线P图

上周四，全网掀起的Gemini 2.0多模态热潮，只需动动嘴就能P图。

不仅能去水印，还能上传图片进行在线P图，让众多网友直呼效果好到爆。

可以直接用于图片上色。

还可以根据绘线稿图，生成对应的房屋渲染图。

短头发一秒也能变成长头发。

甚至还能一键换装。

是不是贼有意思。

小而精的Gemma 3

在上周，Google开源的Gemma 3模型，可直接在手机上跑的小模型，但实力不容小觑。

实力超DeepSeek V3、o3-mini，更是在LMArena竞技场中，Gemma 3取得了1339 ELO的高分排进了榜单前十。

谷歌称Gemma 3 是单个 GPU 或 TPU 上运行的功能最强大的模型。

此外Google还透露后续将Veo 2模型同步到Gemini官网。

看到这里，是不是会感叹Google更新的节奏太快了，反观老对手OpenAI最近没有一点更新的动静，难道是在憋大招！

.END.

往期文章回顾

免责声明：本内容来自腾讯平台创作者，不代表腾讯新闻或腾讯网的观点和立场。