英伟达亲自下场，对标GPT4！发布NVLM多模态开源大模型

北茗的AI笔记

2024-10-03 18:08发布于黑龙江

全文1059字，阅读约需4分钟，帮我划重点

划重点

01Nvidia推出全新开源人工智能模型NVLM 1.0系列，直接对标OpenAI和Google等科技巨头的闭源AI模型。

02旗舰产品NVLM-D-72B模型拥有高达720亿个参数，在视觉与语言任务上表现出色，文本任务性能提高4.3个百分点。

03Nvidia选择开源，公开模型权重和训练代码，加速AI领域创新进程，使中小型企业和独立研究人员有机会与科技巨头分庭抗礼。

04然而，开放AI技术带来潜在风险，需要建立负责任的使用框架，确保强大工具不被误用。

05未来数月或数年内，NVLM 1.0的影响将逐渐显现，企业需适应新的游戏规则，才能在开放的AI战役中胜出。

以上内容由腾讯混元大模型生成，仅供参考

Nvidia，这家以显卡闻名的公司，这次在AI领域也发出了令人震撼的声响。他们推出了全新的开源人工智能模型NVLM 1.0系列，直接对标OpenAI和Google等科技巨头的闭源AI模型，目标明确，就是要在AI界引发一场新的风暴。

在这次发布的NVLM 1.0家族中，旗舰产品NVLM-D-72B模型拥有高达720亿个参数，且在视觉与语言任务上表现出了极强的多样性。不仅如此，该模型在纯文本处理任务上也有显著提升，彻底打破了过去“多模态训练会削弱文本性能”的魔咒。

NVLM-D-72B：文能提笔解题，武能分辨图像

NVLM-D-72B不仅能对图像、视频等复杂视觉输入进行细致入微的分析，它还能处理数学问题，甚至能够像人类一样一步步地进行推理。更值得一提的是，它的文本任务性能比起纯文本训练的模型提高了4.3个百分点。这意味着NVLM-D-72B不仅可以理解图片和文本，还在代码和数学推理上表现突出。

研究人员骄傲地表示：“我们的NVLM-D-72B模型在文本后端任务上取得了重大进展，特别是在数学和编程等任务上，远超其他同类模型。”

AI社区欢呼：Nvidia的开源之举引爆行业

Nvidia这次选择开源，不仅公开了模型的权重，还承诺发布完整的训练代码。这一举动无异于在当前AI界投下了一枚重磅炸弹，让全球的开发者和研究人员都能接触到最前沿的AI技术，不再仅仅是科技巨头的专属。

这一开源举措无疑将加速整个AI领域的创新进程。中小型企业和独立研究人员终于也有机会与科技巨头分庭抗礼，共同推动AI技术的发展。

一个AI研究者在社交媒体上感叹道：“哇哦！Nvidia刚刚发布了一个720亿参数的模型，居然在数学和编程任务上能与4050亿参数的Llama 3.1媲美，而且还能处理视觉任务？”

NVLM 1.0：AI开放时代的启幕

Nvidia这次的NVLM 1.0发布，可能将开启AI行业的新篇章。开放的代码和模型，不仅是技术的共享，更是对现有商业模式的一次挑战。未来，不排除其他科技公司也会感受到压力，逐渐向开放迈进。对中小型企业来说，这无疑是一次绝佳的机遇，能用以前无法企及的工具，参与到技术革新的洪流中。

然而，开放AI技术也带来了潜在的风险。随着先进AI的可及性大幅提升，滥用的可能性也随之上升。AI界现在需要的不仅仅是技术上的突破，更要建立负责任的使用框架，确保这些强大的工具不会被误用。

这也给AI商业模式带来了新的思考空间。如果所有最先进的模型都可以免费获得，那么未来公司们要如何保持竞争力？如何为用户创造更大的价值？这些问题，将在未来数月或数年内，随着NVLM 1.0的影响逐渐显现。

毫无疑问，Nvidia已经在AI领域打响了第一枪。接下来的问题是，这场战争将如何蔓延，哪些企业能快速适应新的游戏规则，在这场开放的AI战役中胜出。

查看原图 43K