1.2025年1月31日,英伟达官网宣布推理开放模型DeepSeek R1正式在NVIDIA NIM平台上提供预览版。
2.DeepSeek R1模型成本仅为同类模型的1/20,推理成本是OpenAI模型的1/30,且开源。
3.由于成本降低,投资者担心AI模型需求减少,英伟达股价在1月27日下跌16.86%。
4.另一方面,英伟达与DeepSeek合作旨在扩大生态、吸引开发者,并回应供应链担忧。
5.DeepSeek开源可能推动行业创新,加剧技术竞争,未来需关注其发展。
以上内容由腾讯混元大模型生成,仅供参考
最近,AI 圈出了件大事!2025年1月31日,英伟达官网宣布,推理开放模型DeepSeek R1正式在NVIDIA NIM平台上提供预览版,这意味着DeepSeek R1模型已作为NVIDIA NIM微服务预览版在英伟达开发者平台上线,双方开启了技术合作。此消息经风口财经等报道后,瞬间引发了业内关注。
DeepSeek - R1是个超厉害的大语言模型,推理、数学、编码样样精通。它最让人惊讶的就是成本超低。训练的时候,只用了2048块符合美国出口管制版本的英伟达H800 GPU,花了55天,才花了557.6万美元,成本只有同类模型的1/20,推理成本是OpenAI模型的1/30。而且它还是开源的,就像“AI界的拼多多”,性价比超高。从技术上讲,它用了混合专家模型(MoE)、多头潜注意力(MLA)和双重流水线(DualPipe)等技术优化,计算效率大大提高。
这消息一出来,股票市场都跟着动了。1月27日那天,英伟达的股价一下子跌了16.86%,市值少了差不多5900亿美元,博通这些芯片股也跟着跌。为啥呢?因为投资者担心AI模型成本变低,大家就不需要那么多高端GPU了,这会影响英伟达这些公司的发展。
不过,英伟达和DeepSeek合作也是有想法的。一方面,能扩大自己的生态,吸引更多开发者;英伟达推出的NIM微服务基于HGX H200系统,每秒可处理3872个tokens ,其API灵活易用,基于云原生架构,此次预览版发布旨在吸引开发者测试反馈,未来还将融入英伟达AI Enterprise平台,这被视为英伟达在企业级AI市场的重要布局,有助于加速高性能模型商业化。另一方面,它强调用的H800 GPU符合出口规定,回应大家对供应链的担心。而且,从长远看,英伟达觉得这里面有个“杰文斯悖论”。啥是杰文斯悖论呢?简单说,就是技术进步让资源用得更有效率,成本降低了,大家就会用得更多,最后总的使用量反而会增加。就像以前蒸汽机效率提高了,煤炭用得却更多;汽车省油了,石油消耗总量却没减少。在AI这里也是,以后人工智能用得更方便高效了,对计算资源的需求可能会更多。
此外,欧洲对DeepSeek开源特别高兴。比如法国之前推出的露西模型,没几天就下架了,说明他们自己做AI模型有点难。现在DeepSeek开源,他们就能借着这个模型参与到AI竞争里,这对他们来说是个难得的机会。
当然,DeepSeek 以后也有不少挑战,有人怀疑它成本是不是真这么低,技术是不是原创的。但不管怎么说,它的出现可能会让更多小公司靠优化算法参与竞争,推动行业创新,也会让不同地区在技术方面的竞争更激烈。这次的事是AI发展中的一个重要节点,未来会怎么样,我们可得好好关注。