客户端
游戏
无障碍

3

评论

25

31

手机看

微信扫一扫,随时随地看

Roblox放大招:开源AI生成工具Cube 3D,可一句话生成3D模型和场景

AI划重点 · 全文约2915字,阅读需9分钟

1.Roblox推出了开源AI生成工具Cube 3D,可一句话生成3D模型和场景。

2.本周将开源其GenAI 3D基础模型的第一个版本,称为Cube 3D。

3.Cube 3D将支持Roblox未来几年开发的许多AI工具,包括高度复杂的场景生成工具。

4.除此之外,Roblox计划扩展到场景生成和理解,为用户提供他们最感兴趣的体验。

5.Cube 3D模型将于本周晚些时候推出。

以上内容由腾讯混元大模型生成,仅供参考

GDC 2025大会期间,Roblox推出了其Roblox Cube AI工具,这是用于为游戏开发者大会及时构建3D对象和场景的核心生成式AI系统。

该公司表示,本周将开源其GenAI 3D基础模型的第一个版本,称为Cube 3D。Roblox高管Anupam Singh和Nick Tornow在一篇博客文章中说,任何人都可以在Roblox平台上或平台外使用Cube 3D。

去年秋天,Roblox宣布了一个雄心勃勃的项目,即构建一个开源3D基础模型在Roblox上创建3D对象和场景。现在它会紧跟着Cube 3D发布。

Cube将支持Roblox将在未来几年开发的许多AI工具,包括高度复杂的场景生成工具。它最终将是一个多模态模型,在文本、图像、视频和其他类型的输入上进行训练,并将与我们现有的AI创作工具集成。

不过,Roblox并未详细解释将对哪些部分开源,因此,该工具开源之后,是否会有更多的厂商借鉴过UGC,尚不可知。

图片

有关Cube 3D的更多详细信息

Cube 3D可以直接从文本和未来的图像输入生成3D模型和环境。如今,最先进的3D生成使用图像和重建方法来构建3D对象。当没有足够的3D训练数据时,这是一个不错的选择。

然而,由于Roblox平台的性质,该公司在原生3D数据上进行训练。生成的对象与当今的游戏引擎完全兼容,并且可以扩展以使对象具有功能性,这里的区别类似于跑道电影布景。

在电视上,你可能会看到一个功能齐全的赛马场,有看台、车库和胜利车道。但是如果你在那个场景中走来走去,你会很快意识到这些结构实际上是平的。构建一个真正身临其境的3D世界需要完整的功能性结构,你可以开车进入车库,你可以坐在看台上,还有一条带有功能性领奖台的胜利车道。

为了实现这一目标,Roblox从基于文本标记(或字符集)训练的最先进模型中汲取灵感,这样它们就可以预测下一个标记来形成一个句子。这项创新建立在相同的核心思想之上。Roblox建立了标记3D对象和将形状理解为标记的能力,并训练Cube 3D预测下一个形状标记以构建完整的3D对象。

当Roblox将其扩展到全场景生成时,Cube 3D会预测布局并递归预测形状以完成该布局。

任何人都可以根据自己的数据微调、开发插件或训练Cube 3D,以满足他们的需求。Roblox认为AI工具应该建立在开放和透明的基础上,这就是为什么该公司表示它是开源AI社区的坚定合作伙伴。

Roblox发布了其AI安全模型之一,因为它相信分享AI安全的进步有助于整个行业加速创新和技术进步。出于这个原因,该公司还帮助成立了ROOST,这是一个新的非营利组织,致力于利用开源安全工具解决数字安全的重要领域。在开源Cube 3D中,目标是让研究人员、开发者和更广泛的AI社区能够在全行业范围内学习、增强和推进3D生成。

用于创作的Cube 3D

图片

Roblox之前谈到了AI如何加速3D资产、配件和体验的创作。该公司表示,最终AI将实现更加身临其境和个性化的游戏和连接。

帖子里提到,“我们投资基础设施,在创造周期的每个阶段支持AI,既针对这些体验的开发者,也针对在其中花费时间的用户。我们设想了一个未来,开发者将通过在他们的体验中启用AI,为他们的用户提供新的创造方式。这将AI的力量交到8500万日常活跃用户手中,作为他们游戏玩法的一部分”。

在过去的一年里,Roblox通过我们在Roblox Studio中的AI助手推出了几项新功能,为开发者提供创作和减少数小时手动工作所需的工具和功能。借助Cube,我们打算使3D创作更加高效。通过3D网格生成,开发者可以快速探索新的创作方向,并通过快速决定继续前进来提高他们的生产力。

想象一下构建一个赛道游戏。今天,你可以在助手中使用Mesh Generation API,输入一个快速指令,比如“/生成摩托车”或“/生成橙色安全锥”。几秒钟内,API会生成这些对象的网格版本。然后它们可以通过纹理、颜色等来充实。

有了这个API,开发者可以更快地为道具建模或设计他们的空间,不再需要花几个小时为简单的对象建模。它让开发者专注于有趣的事情,比如设计轨道布局和微调汽车操作。这个API节省了创作的每个对象的时间,并让你有时间尝试新的想法,而不用担心花费太多时间或精力。从长远来看,Roblox计划启用更复杂和功能更强大的对象,甚至场景。

这项技术会拓展到每天在Roblox上玩和连接的数千万有创造力的人身上。Roblox看到了一个未来,开发者可以让他们的用户成为使用AI的创造者。启用了网格生成API,玩家可以把他们能想象到的任何东西变成现实。如果玩家想要一辆未来的汽车,他们可以输入“带侧翼的未来红色汽车”或“黑色皮革摩托护套”并看到它的生成。这种游戏中的AI生成将释放一个全新的创造力水平。玩家可以以开发者从未想象过的方式个性化他们的体验,这将使他们的游戏更加引人入胜。

引擎盖下:3D和文本/图像标记之间的交叉聚焦

关键的技术挑战是将文本和图像与3D形状联系起来。核心技术突破是3D标记化,它允许我们将3D对象表示为标记,就像文本可以表示为标记一样。这使我们能够预测下一个形状,就像语言模型预测句子中的下一个单词一样。

为了实现3D生成,Roblox设计了一个统一的架构,用于自回归生成单个对象、形状完成和多对象/场景布局生成。自回归transformers是使用先前输入来预测下一个组件的神经网络。这种架构提供了可扩展性和多模态兼容性,以便随着Roblox扩展模型,它将与许多不同类型的输入(文本、视觉、音频和3D)一起工作。Roblox正在开源这个模型。在这个初始阶段,创作者将能够根据文本提示生成3D对象。在未来,Roblox打算让创作者能够基于多模态输入生成整个场景。

为了训练生成预训练转换器(GPT)进行形状生成,Roblox使用离散的3D形状标记并将它们与文本提示对齐。这种新颖的方法为我们进入可玩的3D场景生成世界做好了准备。

Cube发展的方向

图片

今天,世界上很多地方都使用AI来处理文本,预测句子中的单词。许多人还将其用于图像,预测像素。在创建场景时,这变得更加复杂,所有这些元素都聚集在一起,需要在上下文中相互作用。例如,想象一个简单场景的体验,可以描述为“一个骑在摩托车上的化身,站在有树的跑道前。”

构建这种体验需要许多元素。树木是两个3D网格的组合,摩托车是一个带有细节和三角形的密集网格,建筑物由Roblox部件组成。摩托车上的化身的身体、四肢和头部具有更复杂的几何特征。最后,Roblox需要一种方法通过布局将它们结合在一起。为此,该公司需要边界框(bounding boxes),它勾勒出一个对象来定义其大小和位置,以知道如何排列这种几何形状。这是一个艰苦的过程,但AI能够帮助每一步。有了AI,创作者可以更快地到达第一个版本,并有更多时间测试新想法或改进他们的场景。

当Roblox到达这种程度时,它希望创建的3D对象和场景功能齐全。它称之为4D创造,其中第四个维度是对象、环境和人之间的交互。实现这一目标不仅需要构建沉浸式3D对象和场景的能力,还需要理解这些对象之间的上下文和关系。这就是Roblox与Cube的发展方向。

除了网格生成的第一个用例之外,Roblox计划扩展到场景生成和理解。该公司将能够为用户提供他们最感兴趣的体验,通过在上下文中添加对象来增强场景。例如,在体验森林场景时,开发者可以要求Assistant将树上所有郁郁葱葱的绿叶替换为秋叶,以指示季节的变化。

AI助手工具对开发者的请求做出反应,帮助他们快速创建、调整和扩展体验。Roblox将在继续改进和扩展基础模型的同时分享更新和新功能。Cube 3D模型将于本周晚些时候推出。

免责声明:本内容来自腾讯平台创作者,不代表腾讯新闻或腾讯网的观点和立场。
举报
评论 0文明上网理性发言,请遵守《新闻评论服务协议》
请先登录后发表评论~
查看全部0条评论
首页
刷新
反馈
顶部