谷歌发布 AI 图像生成新工具 Whisk，支持上传多张图片以图生图

IT之家

2024-12-17 09:20发布于山东IT之家官方账号

IT之家 12 月 17 日消息，谷歌今日发布了一款名为 Whisk 的全新 AI 图像生成工具，该工具允许用户使用其他图像作为提示来生成图像，而不需要冗长的文本提示。用户只需提供图像，即可指定 AI 生成图像的主题、场景和风格。

使用 Whisk 时，用户可以为主题、场景和风格分别提供多张图像作为提示。（当然，用户仍然可以选择使用文字提示。）如果手头没有合适的图像，用户还可以点击骰子图标，由谷歌自动填充一些图像作为提示（这些图像似乎也是 AI 生成的）。此外，用户还可以在流程的最后阶段在文本框中输入一些文字，以添加关于目标图像的额外细节，但这并非必需步骤。

Whisk 随后会生成图像，并为每张图像生成相应的文本提示。如果用户对生成结果满意，可以选择收藏或下载图像；如果需要进一步调整，则可以通过在文本框中输入更多文字或点击图像并编辑文本提示来进行优化。

IT之家注意到，谷歌在一篇博文中强调，Whisk 的设计初衷是“快速的视觉探索，而非像素级的精细编辑”。该公司还表示，Whisk 可能会出现“偏差”，因此允许用户编辑底层的提示。

据体验者称，在短暂的使用过程中，Whisk 带来了有趣的体验。图像生成需要几秒钟的时间，虽然生成的图像有时会有些奇怪，但所有生成的内容都易于迭代修改。

谷歌表示，Whisk 使用的是其最新一代的 Imagen 3 图像生成模型，该模型也于今日发布。

查看原图 36K