你好,我是蔚公子,毕业ALL in AI,专注于 AI 提效/教育
就这几天,AI生图界又来了一位王者。
相信已经有不少朋友知道了,它就是GPT-image-2。
说实话,去年年底Nano Banana 2 的问世,总算补齐了短板,让靠谱的 AI 画图成为现实。
原本我以为已经告一段落了,但如今全新的 GPT-image-2 登场,大有全面赶超、取代大香蕉的架势。
这两天神图满天飞,我当然也看到了。这张“遥遥领先”的测评图,也是说明了实力。
这次更新最核心的突破,就是文字渲染更加稳定,无论是大标题、小字文案、价格标签、界面按钮,还是图文列表、中文信息图表,没有乱码、错字、变形的老问题,都得到了更强的解决。
而且 GPT-image-2 这次真“开窍”了,画图前会自己动脑子想想,还能上网查资料。
但到底怎么样,还是得测了才知道,我直接来了一手实测,菜单、课本、游戏UI、电影海报等等12个场景,可以说是几乎每张图都相当到位✨
该图片疑似使用了AI生成技术,请谨慎甄别
首先要测的,当然是最近最火的各大“外国主播”纷纷卖起中国货的这个超级爆款——什么川普在线卖老干妈,山姆奥特曼卖海飞丝,都给你搞了出来。那我们直接拿马斯克实测一手,让他卖卖我们的国酿茅台🤔直播间画面,马斯克作为主播在直播间卖中国茅台酒,弹幕写的是,“马哥来中国了?”“茅台牛逼!”“AI换脸!这也太假了吧!”和一堆“666”,图片比例9:16还有美女跳舞直播间,我们同样可以来一个,真实感也相当之强。直播间画面,一个美女作为主播在直播间跳舞,弹幕写的是,“宝宝我爱你”“好看,爱看”“女神”等等,图片比例9:16比如我就直接上传了一张《凡人修仙传》主角韩立的正面截图,看看它能不能生成一张电影质感的海报。这是动漫《凡人修仙传》的主角韩立,帮我做一个电影海报,横屏16:9,要有设计感,吸睛度高,可以参考白蛇缘起的设计风格,一些次要角色要求自行添加
这对做AI视频的小伙伴帮助还是挺大的,以前虽然能做出精美的视频,但是往往有一个问题——别人不愿意点进来看。GPT-Image-2这个效果,直接让观众有点进来的想法,而且让创作者一开始就能有一个比较好的起点。
这种人物海报能做了,那我们还可以再进一步,来帮自己的IP做设定图。如果一开始不知道设定,也可以不用非常复杂的提示词,只需要提出一个大概的要求,它就能够领悟我们的意思。这是我的IP形象,请你给我进一步完善品牌设计,人物设置等等,给我一张较为完整全面的设定图一句话,就生成了角色档案、外观细节、色彩体系、搭配与细节、风格参考等等八大要素。就以大家非常熟悉的《三国演义》为例子,输入提示词:帮我做出传统小说《三国演义》的人物关系图,以蜀国刘备为核心,贯穿所有关键性人物,要求画面精美,古风,典雅,逻辑自洽,横屏16:9,文字不乱码。关键性人物的形象基本上大差不差,相互之间的关系描述的也足够清晰👌没错,旅游攻略也能给我们做了。这些天我预计要去杭州一趟,咱们就以杭州为例。如果有更详细的文字攻略,它就能生成更准确和个性化的内容。帮我生成一份杭州旅游攻略图,要求将每一个景点都介绍清楚,信息足够丰富,横屏16:9,文字不乱码。相信每一座城市都有一些犄角旮旯的餐厅,看着不起眼,但是菜品相当好吃。一般情况有一个共性的问题,就是菜单太简陋了,不像大酒店,每一道菜都相当的精美拍摄文字介绍。设计一个中国湘菜的菜单,菜品内容有:剁椒鱼头、毛氏红烧肉、辣椒炒肉、腊味合蒸、东安子鸡、组庵鱼翅、永州血鸭、小炒黄牛肉、口味虾、外婆菜等等。要求有设计审美,吸引人,横屏16:9,文字不乱码。而且每道菜几乎都不一样,整体排版、文字都清清楚楚。吃喝玩乐,对于很多年轻人来说,旅游的过程中少不了要玩游戏。我们原创一款封神榜的游戏,用GPT-Image-2来帮它做UI界面图。参考《无畏契约》(Valorant)的游戏风格,生成一个以封神榜为主题、神话风格的 FPS 游戏选人界面 UI 图片。上面霍霍完马斯克,这里我们再帮找山姆奥特曼“卖卖货”。用openai的风格出一款AI眼镜产品,来做一个有果味风的介绍海报。生成一个AI眼镜产品发售的介绍海报,风格需要符合 OpenAI 以往的设计风格,内容需要简洁,整体呈现苹果风、卡片化、高级感这要不说,还真以为是openai出的新AI眼镜👓🧐虽然AI小龙虾的风已经吹遍大江南北,但是相信还是有一大部分小伙伴不懂,那我们直接用GPT-Image-2来生成一个。用可爱风格画一张openclaw小龙虾AI科普图,图片比例9:16但仔细一看,诶,怎么它对小龙虾理解的还是有些问题🤔“专为小龙虾研究而生”,“更懂小龙虾”,这两句貌似是不对吧。好好好,看来检索能力还有待加强,不知道是不是全网唯一发现的bug。而且这个实际上我觉得更炸,你没看错,连教材课本页,都能帮我们生成了,而且提示词相当简单。只能感叹一句,AI时代,学生的学习资料是真的丰富啊,这个效果,直接当复习资料都没问题🔥最后来一个实用性的结尾,来一个高级杂志风格的口红科普图。用高级杂志感风格画一张口红种类和制作过程的科普图。
啧啧,太细了太细了,兼具美观和实用性。
说实话,我也是第1次了解口红如何制作的,也算是涨知识了🤔
十三、蔚公子的洞察
过去一年,图像模型的进步很多时候更像是"展示能力"很强,但真正进入工作流还是有点费劲。
这次 GPT-Image 2,开始真正接近生产工具了。正如上面十二个例子展示的,在各个方向都能看到它的效果已经相当出色。
以往可能要花上起码半天制作的内容,今天只需要一句提示词。这个效率的提升可以明显感知到——甚至对普通人来说,以前是压根做不出来这样的图的。
终于,普通人也能把脑子里的想法,比较体面地端到别人面前。
而对有更高设计需求的从业者和老板来说,制作难度不断下降、成品稳定率不断提高,意味着素材可以源源不断,以前高昂的时间和金钱成本能被降下来。
当然,降成本只是表象,真正改变游戏规则的是另一件事:
它把“做图”的门槛从“专业技能”直接砍成了“表达能力”。以前你要会PS、会排版、会调参,现在你只需要说清楚自己要什么。创意不再被技术卡脖子,想法从脑子里到屏幕上,中间不再隔着一道软件的高墙。
当所有人都能体面地交付出图时,比拼的就不是“能不能做”,而是“想没想到”。工具已经铺好了路,接下来只比谁跑得快。
所以别只收藏。挑一个最心动的场景,今晚就去跑一张。谁先把它焊进工作流,谁就先拿到下一阶段的船票。
GPT-image-2 不是终点,它或许是一个新的信号:
AI生图的玩具时代彻底结束了,生产工具的时代,真的来了🔥