DeepSeek进军文生图：发布新款开源多模态模型Janus-Pro和JanusFlow

三言科技

2025-01-28 08:32发布于北京三言财经官方账号

+关注

三言科技1月28日消息，日前，DeepSeek发布了名为Janus-Pro和JanusFlow的一系列开源多模态AI模型。

DeepSeek表示，这款大模型是2024年11月发布的JanusFlow大模型的高级版本；相较前代模型，Janus-Pro优化了训练策略、扩展训练数据，模型也更大。Janus-Pro在多模态理解和文本到图像的指令更总功能方面取得重大进步，还增强了文本到图像生成的稳定性。

DeepSeek的展示图显示，在文生图GenEval和DPG-Bench基准测试中，Janus-Pro-7B的准确率较前代Janus大幅提高，准确率测试结果分别为80%和84.2%，高于包括OpenAI DALL-E 3在内的其他对比模型，Janus的准确率分别为61%和79.7%。

其中，Janus-Pro是统一多模态与生成的创新框架，通过解耦视觉编码的方式，提升模型在不同任务中的适配行与性能。

该模型机可适配视觉问答、图像标注等多模态场景。

而JanusFlow是通过生成流与自回归语言模型融合实现统一框架；不仅能处理理解任务，还能够生成高质量图像。

查看原图 432K

免责声明：本内容来自腾讯平台创作者，不代表腾讯新闻或腾讯网的观点和立场。