划重点
01英伟达CEO黄仁勋推出Cosmos平台,这是一个世界模型平台,旨在解决物理AI领域数据严重不足的问题。
02Cosmos平台发布了8个模型,参数量从4B到14B不等,分为扩散和自回归模型两类,支持文本生成视频和文本+视频生成视频两种生成方式。
03除此之外,英伟达还公开了Cosmos的技术报告,华人学者在项目中承担了大量工作。
04报告展示了如何微调Cosmos WFM以支持不同的物理AI应用,如相机控制和后训练WFM。
05为了保护开发人员,英伟达开发了功能强大的防护系统,包括前置防护系统和后置防护系统。
以上内容由腾讯混元大模型生成,仅供参考
英伟达 API 目录:https://build.nvidia.com/explore/simulation Hugging Face:https://huggingface.co/collections/nvidia/cosmos-6751e884dc10e013a0a0d8e6
NVIDIA Cosmos:https://github.com/NVIDIA/Cosmos
NVIDIA Cosmos Tokenizer:https://github.com/NVIDIA/Cosmos-Tokenizer
NVIDIA Nemo Framework:https://github.com/NVIDIA/Nemo
对于基于扩散的 WFM,预训练包括两个步骤:1)Text2World 生成的预训练,以及 2)Video2World 生成的预训练;
对于基于自回归的 WFM,预训练包括两个步骤:1)基础的下一 token 生成,以及 2)文本 - 条件 Video2World 生成。
查看原图 195K