三言科技1月28日消息,日前,DeepSeek发布了名为Janus-Pro和JanusFlow的一系列开源多模态AI模型。
DeepSeek表示,这款大模型是2024年11月发布的JanusFlow大模型的高级版本;相较前代模型,Janus-Pro优化了训练策略、扩展训练数据,模型也更大。Janus-Pro在多模态理解和文本到图像的指令更总功能方面取得重大进步,还增强了文本到图像生成的稳定性。
DeepSeek的展示图显示,在文生图GenEval和DPG-Bench基准测试中,Janus-Pro-7B的准确率较前代Janus大幅提高,准确率测试结果分别为80%和84.2%,高于包括OpenAI DALL-E 3在内的其他对比模型,Janus的准确率分别为61%和79.7%。
其中,Janus-Pro是统一多模态与生成的创新框架,通过解耦视觉编码的方式,提升模型在不同任务中的适配行与性能。
该模型机可适配视觉问答、图像标注等多模态场景。
而JanusFlow是通过生成流与自回归语言模型融合实现统一框架;不仅能处理理解任务,还能够生成高质量图像。
查看原图 432K