1.谷歌的Gemini 2.0 Flash图像编辑功能引发关注,被网友戏称为「水印粉碎机」,能轻松消除专业图库的防盗水印。
2.该功能目前仅限AI Studio体验,但已吸引众多网友实测,发现其去除水印效果显著,甚至能一次生成多张图片。
3.然而, Gemini 2.0 Flash在处理复杂水印和文字时仍存在局限,如满屏+半透明水印和大量文字无法完全消除。
4.除此之外,该功能还具有视觉故事功能,能一次性生成带配图的内容,如教程和卡皮巴拉冒险小故事。
以上内容由腾讯混元大模型生成,仅供参考
编辑 | Sia
今儿一早,谷歌的 Gemini 2.0 Flash 突然冲上风口浪尖——一个刚开放的图像编辑功能,竟然被网友玩成了「水印粉碎机」!连 Getty Images 等专业图库的防盗水印都能咔咔消除!
虽然挂着「实验功能」的免战牌(目前仅限 AI Studio 体验),但也架不住网友实测打脸。
隔壁家的 Claude 和 GPT-4o 早就把这类请求拉黑名单了,唯独 Gemini 像个铁憨憨,来者不拒照单全收。
我们也拿了张明星 G 社的生图试了一下,真就一句话的事儿。
为了防止朋友圈盗图,一位鸟友刚学会用美图秀秀给作品加水印。
我一句话就给她去掉了。
小红书水印也能顺利去掉。
大面积的水印,貌似也能搞定。
难道 Gemini 2.0 Flash 真是完美的水印去除器?其实,不是。
这是一篇财新报道的截图,系统会自动添加水印,也是半透明+全屏。
为什么会这样呢?
我们推测,和「脑补」图片相比,「脑补」文字实在难太多。
换句话说,这个新模型应该是通过一些方式重新画了一张图,而不是真会编辑掉水印。
它会根据学习到的模式生成全新图像,包括填充原来水印的位置,而不是直接复制或重复使用原始图像。
其实,一些眼尖网友也发现比如这张图「去水印」后,山都消失了,完成是一张新照片。
要知道,传统 AI 作图要像打乒乓球似的在文字模型( LLM )和画图模型(扩散模型)间传话。
有了这个真正的原生多模态生图工具,一番实测, 这速度比我 PS 按保存键还快!而且 ,OneShot (不用反复生成)的概率很高。
用网友的话说,它基本上完成了人类使用 Photoshop 克隆工具所做的事情,但只需几秒钟而不是一个小时。
你可以直接用文字进行各种 PS 。
将文本快速清晰地集成到图像中,也很出色。替换图片文字,居然一次就成功(也许是运气好?)。
这些体验,几乎都是一次成功。
脑洞再大点。同时输入两张图片,可以轻松生成广告图片。
怎么样,可还行?
这个案例更复杂。刘雯要同时展示衣服和包包。
考虑到一次就能生成这个水平,已经很意外。
模型可以连续出图、还能保持风格一致性,不必每次都从头开始。
就像和专业修图师沟通,你只管提要求,它负责改,而且反应很快。
Jennie 变换不同角度的图片,还能「脑补」全身图:
让全智贤不断变换造型,都是一次性成功。
最好玩的是这个例子。清空房间,按照你的要求,重新装修设计。
这是模型最后给到的中式家居风格。
网友的一个案例。
首先想要「一个舒适的阅读角落,里面有壁炉、摆满小说的书架和一把舒适的大扶手椅。」
然后,进一步要求「用柔和温暖的灯光营造夜晚的氛围」、「扶手椅上放一只睡觉的猫。」
最后,「给房间营造复古的维多利亚风格」。
最终结果几乎和他想象的一模一样。
除了唠嗑式生图、修图,Gemini Flash 2.0 还有一个很好玩的功能——视觉故事,一次性生成带配图的内容。