图森未来正式发布图生视频大模型“Ruyi”

钛媒体App 12月17日消息,今日,图森未来宣布正式发布图生视频大模型“Ruyi”,并将Ruyi-Mini-7B版本正式开源,用户可以从huggingface上下载使用。据介绍,Ruyi是一个基于DiT架构的图生视频模型,它由两部分构成:一个Casual VAE模块负责视频数据的压缩和解压,一个Diffusion Transformer负责压缩后的视频生成。模型的总参数量约为7.1B,使用了约200M个视频片段进行训练。Ruyi是图森未来正式发布的第一款“图生视频”模型。