IT之家 10 月 27 日消息,OpenAI 本周公布了一款名为 sCM(Continuous-Time Consistency Model)的新型 AI 文生图方案。
与传统的扩散模型相比,sCM 仅需两个步骤即可生成高质量样本,号称能够将文生图效率提升约 50 倍,且生成的样本质量能与“业界较强的扩散模型”相比较,为 AI 文生图提供了新的方案。
目前业界通常使用扩散模型生成图片及音视频,但传统扩散模型的取样过程通常缓慢,通常需要数十到数百个逐步降噪的过程才能生成高质量样本(例如小伙伴们使用 SD“炼丹”绘图就需要等待特别长的降噪时间),这使得相应模型效率低下,不适合商业化应用。
虽然目前业界已出现一些技术以加快扩散模型的速度,但无非只是利用复杂训练过程“提纯”模型,或通过降低输出样本质量下降以提升效率。
而 OpenAI 研究团队则提出了一种名为 sCM 的文生图方案,这一生成模型方法绕开了传统扩散模型范畴,号称仅需两个取样步骤即可生成与扩散模型质量相当的高分辨率样本,极大缩短了生成时间。
IT之家获悉,sCM 训练方法主要利用预训练扩散模型蒸馏出来的知识直接打造模型,号称能够在缩短取样时间的同时保持高质量样本生成。
研究人员使用 ImageNet 512x512 数据集,利用 sCM 方法训练模型,号称能够生成细节丰富且高质量的图像,展示其在高分辨率生成方面的能力。尽管 sCM 只有两个取样步骤,生成样本的质量仍接近业界“最佳的扩散模型”,号称“差异不到 10%”。