AI生图的时候,当提示中的文字太多渲染就容易崩,国外模型很多人用不了,国内一有新模型我就去测试,发现多少都有瑕疵。最近发现一个新开源的模型,百度ERNIE-Image团队出的,刷到外网很多人对这个模型评价很高,好奇心驱使必须要体验一下,根本停不下来,因为生成结果意外的好。
正好GPT的Image 2全量上线,部分场景里同一个提示词百度ERNIE-Image和Image2生成的效果差不太多,已放对比图(7-9图)。重点是百度ERNIE-Image免费开源,对国内用户非常友好。
先说结论:ERNIE-Image的文字渲染比国内其他图像模型效果更好。实测生成的9宫格小红书图文,黑板插画,网页文字生成,文字渲染效果拉满。甚至密集的正文排版,中英文都能清晰渲染,笔画不出错。消费级显卡可跑,NanoBanana平替。
为什么推荐它?
1.指令遵循能力强
强在文字渲染和指令遵循,能稳定处理复杂提示词关系和知识密集型描述,中英日文多语种混合生成也没问题。做信息图图文笔记很合适,标题副标题正文分层,一次生成不用后期改。擅长带有明确版式动漫分镜,网页demo,多宫格信息图组合视觉表达效果都很好。
2.开源免费,协议友好
Apache2.0协议,商用也行。权重和代码都在Hugging Face上,ComfyUI工作流也能直接用。
3.消费级显卡能跑
消费级显卡能跑,仅需8B参数量,普通玩家的24G显存显(如 3090/4090就能流畅部署,不用去实验室抢算力,在家也能跑出S级效果。NanoBanana平替,普通玩家也可以免费用的主流图像模型。
怎么用?
在线体验,不用装环境,有手就行。
1️⃣星河社区AIStudio:https://aistudio.baidu.com/
2️⃣HuggingFace Demo:https://huggingface.co/spaces/baidu/ERNIE-Image-Turbo
无需登录注册,没有生成历史记录,记得生成一张下载一张(鼠标放在生成的图片右击复制图片,可以粘贴文档,对话框内另存电脑。)
也可以自行部署
Hugging Face下载权重,GitHub clone代码,ComfyUI导入工作流。想微调也行,参数量不大,门槛比大模型低很多。
Model in Github: https://github.com/baidu/ernie-image
Model in Hugging Face:https://huggingface.co/baidu/ERNIE-Image
Comfy:https://huggingface.co/Comfy-Org/ERNIE-Image
GGUF:https://huggingface.co/unsloth/ERNIE-Image-GGUF
#文心
#文心大模型
#百度
#Nanobanana
#AI工具
#gptimage2
该图片疑似使用了AI生成技术,请谨慎甄别
该图片疑似使用了AI生成技术,请谨慎甄别