客户端
游戏
无障碍

1

评论

3

1

手机看

微信扫一扫,随时随地看

细数Google最近迭代的5大AI功能,OpenAI要坐不住了!

作者|子川

来源AI先锋官


Google这波连着串的更新,太爽了!

就在昨天,Gemini推出了它们的Canvas功能!

不单单可以生成可视化网页,而且还能直接在画布上修改文章的内容,简直就是Claude Artifacts和ChatGPT的Canvas的结合体。

图片

主要的功能有俩:文档编辑和代码实时预览功能。

Gemini Canvas的文档编辑功能,简直就是ChatGPT Canvas的翻版。

用户可以实时编辑文档,Gemini 提供即时反馈和建议,可选中任意段落,让Gemini帮你修改语气(更简洁、专业或口语化)、调整长度或格式。·

比如,让它生成一篇鲁迅风格的作品,并选中其中一段句子,提出修改建议:增加更多的细节。

Thumbplayer Poster Plugin Image
播放
下一个
打开循环播放
00:00
/
00:00
倍速
3.0X
2.0X
1.5X
1.25X
1.0X
0.75X
0.5X
语言
多音轨
AirPlay
0
静音播放中,点击 恢复音量
画中画
网页全屏
全屏
error-background
你可以 刷新 试试
视频信息
1.33.6
播放信息 上传日志
视频ID
VID
-
播放流水
Flowid
-
播放内核
Kernel
-
显示器信息
Res
-
帧数
-
缓冲健康度
-
网络活动
net
-
视频分辨率
-
编码
Codec
-
mystery
mystery
-

按住画面移动小窗

X

除了和ChatGPT一样的Canvas功能之外,Gemini甚至更进一步。
可以直接在 Gemini上体验Claude的Artifacts功能。
支持多种编程语言,包括 Python、JavaScript 等,无论你是想开发 Web 应用、编写脚本,还是创建交互式体验,Gemini Canvas 都能满足你的需求。
重要的是实时迭代,用户可以要求 Gemini 修改代码,例如添加输入字段或按钮,并立即查看更新后的预览。
它的效果到底如何,我们来实际测试一下。
先来一个简单,让它生成可交互的五子棋小游戏,5秒不到,刷刷刷,一个简单的五子棋的代码就写出来了,甚至还可以和朋友在这个页面直接来上一局。

Thumbplayer Poster Plugin Image
播放
下一个
打开循环播放
00:00
/
00:00
倍速
3.0X
2.0X
1.5X
1.25X
1.0X
0.75X
0.5X
语言
多音轨
AirPlay
0
静音播放中,点击 恢复音量
画中画
网页全屏
全屏
error-background
你可以 刷新 试试
视频信息
1.33.6
播放信息 上传日志
视频ID
VID
-
播放流水
Flowid
-
播放内核
Kernel
-
显示器信息
Res
-
帧数
-
缓冲健康度
-
网络活动
net
-
视频分辨率
-
编码
Codec
-
mystery
mystery
-

按住画面移动小窗

X

如果你觉得黑白两色的棋子不好看,还可以提出要求让Gemini进行修改。
图片
也能生成产品的原型图。比如让告诉:我需要设计一个旅游App,帮我生成首页、功能页面、登录页的产品原型图。

Thumbplayer Poster Plugin Image
播放
下一个
打开循环播放
00:00
/
00:00
倍速
3.0X
2.0X
1.5X
1.25X
1.0X
0.75X
0.5X
语言
多音轨
AirPlay
0
静音播放中,点击 恢复音量
画中画
网页全屏
全屏
error-background
你可以 刷新 试试
视频信息
1.33.6
播放信息 上传日志
视频ID
VID
-
播放流水
Flowid
-
播放内核
Kernel
-
显示器信息
Res
-
帧数
-
缓冲健康度
-
网络活动
net
-
视频分辨率
-
编码
Codec
-
mystery
mystery
-

按住画面移动小窗

X

也能用它生成此前大火的“一个小球在六边形框中跳动”的可视化页面。

Thumbplayer Poster Plugin Image
播放
下一个
打开循环播放
00:00
/
00:00
倍速
3.0X
2.0X
1.5X
1.25X
1.0X
0.75X
0.5X
语言
多音轨
AirPlay
0
静音播放中,点击 恢复音量
画中画
网页全屏
全屏
error-background
你可以 刷新 试试
视频信息
1.33.6
播放信息 上传日志
视频ID
VID
-
播放流水
Flowid
-
播放内核
Kernel
-
显示器信息
Res
-
帧数
-
缓冲健康度
-
网络活动
net
-
视频分辨率
-
编码
Codec
-
mystery
mystery
-

按住画面移动小窗

X

同时,Gemini Canvas还支持协作共享,用户可以和他人实时协作编辑文档或代码,非常适合团队之间的合作。
这一周多时间里,Google动作不断,各种功能层出不穷,没有任何套路,开箱即用,重点还都免费。
下面我们来盘点最近Google上新的功能。
根据你搜索记录提供帮助功能
这个功能主要是通过整合用户Google搜索的历史数据,结合Gemini 2.0 Flash Thinking Experimental模型,实现了更精准的智能响应。
比如询问旅行建议时,系统会自动关联近期你使用Google搜索的景点、酒店或机票信息,生成结合个人偏好的行程方案。
图片
换句话说,搜的越多,你的Gemini就越懂你。

Deep Research底层模型更新
终于!将Deep Research功能的底座换成了Gemini 2.0 Flash Thinking!
图片
Deep Research的底层模型是Gemini 1.5 Pro,不过上线,就遭到群嘲模式,太不好用了。
而现在更换到Gemini 2.0 Flash Thinking模型,质量明显有了质的飞跃,给大家来直观感受一下。
提示词:搜索腾讯近5年的财报,并预测明年5月份的股票会是多少!
它首先会收集腾讯近五年的财报信息,并分析影响腾讯控股股票价格的因素,最后再进行预测。

图片

跟OpenAI的Deep Research的不同是,他会给你把框架和节奏拆完,让你清晰的看到后面它会执行哪些步骤,你点击开始研究之后,他才会去整个互联网上去搜索。


动动嘴,就能在线P图
上周四,全网掀起的Gemini 2.0多模态热潮,只需动动嘴就能P图。
不仅能去水印,还能上传图片进行在线P图,让众多网友直呼效果好到爆。
图片
可以直接用于图片上色。
图片
还可以根据绘线稿图,生成对应的房屋渲染图。
图片
短头发一秒也能变成长头发。
图片
甚至还能一键换装。
图片
是不是贼有意思。

小而精的Gemma 3
在上周,Google开源的Gemma 3模型,可直接在手机上跑的小模型,但实力不容小觑。
实力超DeepSeek V3、o3-mini,更是在LMArena竞技场中,Gemma 3取得了1339 ELO的高分排进了榜单前十。
图片
谷歌称Gemma 3 是单个 GPU 或 TPU 上运行的功能最强大的模型。
此外Google还透露后续将Veo 2模型同步到Gemini官网。
看到这里,是不是会感叹Google更新的节奏太快了,反观老对手OpenAI最近没有一点更新的动静,难道是在憋大招!


 .END.

往期文章回顾
免责声明:本内容来自腾讯平台创作者,不代表腾讯新闻或腾讯网的观点和立场。
举报
评论 0文明上网理性发言,请遵守《新闻评论服务协议》
请先登录后发表评论~
查看全部0条评论
首页
刷新
反馈
顶部