1.英伟达在GTC 2025大会上发布了四年三代GPU架构路线图,包括Blackwell、Rubin、Rubin Ultra和Feynman等芯片。
2.黄仁勋表示,英伟达正在构建一个从市区、高速公路再到郊区的庞大AI帝国,CPU是市区,GPU是高新区,Vera Rubin则是关键的桥梁。
3.除此之外,英伟达还推出了AI推理服务软件Dynamo,旨在为部署推理AI模型的AI工厂最大化其token收益。
4.然而,尽管英伟达在AI领域取得了显著成绩,但其股价在演讲结束后仍下跌3.5%。
以上内容由腾讯混元大模型生成,仅供参考
作者|Xuushan 编辑|伊凡
现场一票难求,线上股价狂跌。
“买得越多,省得越多,赚得越多。”
英伟达GTC大会上黄仁勋打响了今年AI界带货最强Slogan。
在加利福尼亚州圣何塞SAP中心,一身标志性皮衣的黄仁勋快步上台,表示今年的GTC大会,是AI超级碗——AI正在解决更多行业与公司的更多问题,作为科技行业的风向标,这场大会涉及1000场会议、2000名演讲者和近400家参展商,超25000+参会人员。门票在会前被炒到了万元高价,并且早已售罄。
此次GTC大会对英伟达来说,是至关重要的一战。
外界所关注的,AI的热潮是否已经达到顶峰?AI芯片的销售是否放缓?当DeepSeek证明了另一条性价比更高的计算路线时,还在坚持大算力的英伟达还能否坐稳AI基建王者的宝座?
会前投资者的种种质疑在黄仁勋为GTC准备长达120分钟的演讲之后逐渐消散。英伟达不仅直接公开了四年三代GPU架构路线图,Blackwell Ultra、Rubin、Rubin Ultra、Feynman等芯片悉数上台,而且还提及了AI、数据中心、机器人、CUDA生态等诸多进展。
不过,投资者对此反应平淡,主题演讲结束后,英伟达的股价略有波动,股价下跌3.5%。英伟达生态内的概念股,如台积电、中电港、胜宏科技、鸿博股份君则有小幅下降。其中,英伟达国内算力板第一供应商胜宏科技,股价下跌5.75%。
业界表明,股价下跌的原因主要由于黄仁勋的演讲基本在华尔街的意料之中,许多新的技术进展已在今年的CES中有所涉及,而黄仁勋提及的关于量子计算、具身智能的部分,很难在短期内看到有实质增长的可能。
英伟达半年来的股价走势 来源:TradingView
以下是今日GTC大会主题演讲干货提炼:
1、芯片全家桶全面升级:Blackwell芯片销量提速,将是Hopper的3倍;Blackwell Ultra将是首个拥有288GB HBM3e的GPU,并配有GB300 NVL72机架、HGX B300 NVL16机架组合系统方案,将是今年下半年的主推产品;
首次公布未来三年技术蓝图:2026年推出Rubin架构(FP4算力达100P Flops),2027年Rubin Ultra支持576个GPU集群,Rubin的AI工厂性能或能达到Hopper的900倍;2028年发布Feynman架构;
英伟达还与台积电联合封装光网络芯片,并于今年下半年将推出新版以太网芯片;
2、打造超算中心工厂:面向开发者以及企业研发场景,推出全球最小AI超级计算机DGX Spark以及AI超算DGX Station;推出搭载Blackwell Ultra GPU的DGX SuperPOD,提供AI工厂超级计算,并同步推出DGX GB300和 DGX B300系统,组合提供开箱即用的 DGX SuperPOD AI 超级计算机;上线英伟达Instant AI Factory,实现AI托管服务等;
3、推出AI推理模型系列:推出AI推理服务软件Dynamo,旨在为部署推理 AI 模型的AI工厂最大化其token收益,可将DeepSeek-R1模型生成tokens数量提升30倍以上,每秒处理超30000tokens;推出全新Llama Nemotron推理模型,并帮助企业构建企业级AI数据平台;
4、开源机器人模型:与谷歌DeepMind、迪士尼联手打造的机器人上台互动;亮相全球首个开源且完全可定制的基础模型 NVIDIA Isaac GR00T N1,让通用人形机器人实现推理及各项技能;
5、巩固CUDA生态:推出搭载GH200超级芯片的CUDA-X库,让CUDA-X与最新的超级芯片架构协同工作实现,计算工程工具的速度可提高11倍,计算量可扩大5倍;首次设立量子计算日,并升级cuQuantum库,推动量子计算研究。
会上,英伟达还多次提及中国AI大模型DeepSeek,提及DeepSeek整体有利于英伟达更快速推动生态建设,并不会对英伟达造成负面影响,黄仁勋对此前大幅跳水的股价做出回应。事实上,通过每年迭代一代架构的速度,英伟达将AI算力密度提升周期逐渐缩短。
生成式AI第三年,英伟达通过GTC 2025大会正式宣告其构建AI全栈基建生态的野心,从硬件代际差、生态垄断性和行业标准制定权,英伟达围绕“技术-商业”双闭环的护城河逐渐完善,短期时间内,英伟达在AI基建领域几乎毫无对手。
四年三架构技术路线图揭晓!
黄仁勋:tokens是一切的基础
“去年的一切都是错的,Scaling Law(扩展定律)远没有结束。”黄仁勋直言,扩展定律正在以超过人们预期的方向发展。当AI从过去依赖经验和预训练数据进行学习并推理,转向采用思维链的方式,生成完整推理步骤,对算力的需求指数级提升。
在现场他用Llama 3.3 70B和DeepSeek R1模型进行演示,向他们同时提出一个排座位的问题。传统的Llama模型仅适用439tokens进行训练,最后给出一个错误的答案,而推理模型DeepSeek R1则使用了8559tokens进行反复思考,是Llama的20倍,其中调用的计算资源也是Llama的150倍,最终给出一个正确的答案。
黄仁勋认为数据仍是一切核心,尽管是R1也花费了6080亿的训练数据,而下一代的模型提升或许需要数万亿的数据。Scaling Law所引领的大算力思路在英伟达的叙事中,仍然奏效。甚至,此次大会上,英伟达提出的Scaling Law的三大阶段:Pre-Training Scaling、Post-Training Scaling、Test-Time Scaling“Long Thinking”阶段。整个行业也将会从Agentic AI(AI代理)逐步转向Physical AI(物理AI:指的是让机器人、自动驾驶汽车和智能空间等自主系统能够感知、理解和执行真实世界中的复杂动作。由于它能够生成见解和动作,因此也经常被称为“生成物理 AI”。)。
“我希望大家走在对的方向上”,黄仁勋此次回应,或许也是对此前AI奇点已到,数据不再是AI模型提升的关键等一系列回应的正面回应。今年以来,英伟达的股价跌超13%,市值与2025年1月7日盘中创下的历史高点相比,市值已经蒸发近8200亿美元。在这场股价保卫战上,黄仁勋选择直面市场对英伟达股价与增长潜力的质疑。
表明了数据和算力仍是AI时代最关键的两大方向之后,黄仁勋开始秀起了自己家的百宝箱。从2025年,英伟达将会在四年时间内先后推出Blackwell、Rubin、Feynman三大架构系列芯片。
Blackwell Ultra将承担今年下半年主力产品,该系列其包括GB300 NVL72机架级解决方案以及NVIDIA HGX B300 NVL16系统。GB300 NVL72机架将把72个Blackwell Ultra GPU与36个基于Arm Neoverse的Grace CPU相连,Blackwell Ultra预计将比前代产品(H100)提供1.5倍的FP4推理能力,可以显著加速AI推理能力。
可以看出,Blackwell Ultra相比上一代产品有些提升,但整体性能提升也没有很惊喜,算是小版本升级。
芯片性能的“大升级”或在明年,承载英伟达希望的Rubin系列,将在2026年问世。此前,黄仁勋称其计算能力能够实现“巨大飞跃”。Rubin主要是以发现暗物质的天文学家Vera Rubin的名字命名。
今天,英伟达则进一步透露有关Rubin系列最新信息。明年,Rubin将作为GPU的旗舰芯和Vera作为CPU旗舰芯同期发布。
用一个比喻或许就能表现出英伟达在AI时代的野心——英伟达正在构建一个从市区、高速公路再到郊区的庞大AI帝国。
CPU是市区,GPU是正在开发的高新区,在这两者之间,需要通过一个叫做PCIE的通道连接,车流量就是数据量。如果数据量大,就需要扩大道路,或增加车道。只有CPU能够决定这个分配。一直以来,CPU生态被Arm和英特尔的X86长期垄断。现在,英伟达对他们发起了挑战。
Vera Rubin是英伟达CPU+GPU战略的重要落子,其将于2026年下半年发布,将配备一个名为Vera的定制Nvidia设计CPU。Nvidia 声称,与其前身 Grace Blackwell 相比,Vera Rubin 的性能有了显著提升,尤其是在 AI 推理和训练任务方面。
其中,Vera有88个定制ARM结构的内核和176个线程。同时,Vera还会有一个1.8TB/s NVLink的内核接口,用于与Rubin GPU连接。与传统的互联技术相比,英伟达的这种互联技术的速度更快,能够通过的“车辆”更多。Vera将会取代现有的Grace CPU。据英伟达透露,Vera的新架构设计将会比Grace CPU快两倍。在2021年的GTC大会上,英伟达推出了其第一款CPU——Grace,以Arm架构为核心。
看回Rubin系列,Rubin这次仍然是拼接式的设计,也就是它其实是两个GPU在电路板上拼接在一起,组成了一个新的GPU。性能上,与B300相比,Rubin计算性能提高了3.3倍,能提供1.2 ExaFLOPS FP8训练。
Vera Rubin可提供50 petaflops浮点运算的FP4 推理性能,是Blackwell Ultra在类似机架配置的3.3倍。
2027年,Rubin Ultra将内含4个GPU,支持576个GPU集群,在机架层面,将会比Rubin NVL144配置强大约四倍。同时,英伟达计划在。此外,Feynman同样将会采用Vera CPU。
从最新的技术路线图中可以看出,目前英伟达的GPU更新基本维持在两年一个大版本升级,一年一个小迭代的节奏上行稳步推进,而CPU方向新品节奏稍缓,或许3年左右才会有较大的一个版本升级。
但无论如何,英伟达自研的GPU+CPU生态已经逐渐完善,根据摩根斯坦利统计,英伟达占据了全球AI专用芯片将近77%的市场份额。同时英伟达还一直是台积电的VVVIP客户,几乎拿下了台积电的大半产能,拥有强大的供应链优势。英伟达的Rubin采用了台积电3nm工艺、CoWoS(Chip on Wafer Substrate)封装技术。最先进的制造和封装工艺,意味着这款芯片的性能将大幅度提升,英伟达也将在与台积电的合作中积累丰富的先进制程IP。一位芯片从业人士告诉硅兔君,先进制程的产能一般是有限的,大客户能够获得内测以及订单的优先级。
再加上,英伟达一直在和各行各业的头部公司合作,了解行业内最先进的技术、创新动向以及行业Know-how。可以说,在AI训练侧,英伟达的芯片组合拳几乎无人能挡。这也是英伟达能一路无阻地登上AI基建宝座的核心关键,同样数据中心也为英伟达贡献了大部分营收。
英伟达2014-2024年主营业务收入占比变化
来源:Wind、五矿证券研究所
再加上,英伟达一直在和各行各业的头部公司合作,了解行业内最先进的技术、创新动向以及行业Know-how。可以说,在AI训练侧,英伟达的芯片组合拳几乎无人能挡。这也是英伟达能一路无阻地登上AI基建宝座的核心关键,同样数据中心也为英伟达贡献了大部分营收。
黄仁勋透露,今年,微软、谷歌、亚马逊和Meta四家大型云服务商已经购入360万颗Blackwell芯片,理想预计,2028年数据中心资本支出规模突破1万亿美元。科技巨头们对数据中心建设的热情将会推动着英伟达的芯片销售主要驱动力。2024年三季度,英伟达的GPU市场份额达到90%。
卖铲人的财富传奇还远没有结束,财报显示,该公司截至1月份的2025财年销售额增长了一倍多,达到1246.2亿美元。
投资分析师Vellante 表示:“我们相信GTC 2025将树立另一个里程碑,标志着未来极端并行计算不仅限于最大的公司,而是所有公司的日常。”
但同时,我们也注意到近期财报显示,Blackwell芯片的毛利率正在小幅下跌,下一代GPU能否够顺利投产,下一代GPU是否能继续成为英伟达的“摇钱树”,或许市场还需验证。
Agentic AI+Physical AI,
英伟达的下一代增长涡轮
“AI正在经历一个拐点,它将变得更智能、更有用。”
黄仁勋回忆道两年前,ChatGPT出现的时候,很多复杂的问题和很多简单的问题,它都难以回答。无论训练多少次,研究过多少信息,但对所有问题,它都只思考一次,就像人类的脱口而出一样。但现在有了推理,AI也有了反复思索的能力,思维链的技术能够逐步完善。
黄仁勋认为未来每个企业都会有两个工厂,一个是他们建造的工厂,而另一个则是他们的AI工厂,主要为了科研或者是培训。他在主题演讲一开始就提到Agentic AI以及Physical AI将会是今年讨论的核心。
如果AI在未来将会无孔不入地深入到各行业的每一根毛细血管,那么英伟达正在建立一个更大更强的CUDA生态,这个生态,未来将成为各行业的生长土壤——只要这个行业与AI相关——用的人越多,生态越强、软硬件适配度越好。
迄今为止,英伟达已构建了900多个特定领域的CUDA-X库和AI模型,降低加速计算的准入门槛。今年,CUDA-X将走入更前沿的工程学科,像是天文学、粒子物理学、量子物理学、汽车、航空航天和半导体设计。
“如果整个发布会只讲一张PPT,那么就是这张。”
黄仁勋提到,如果没有CUDA,没有英伟达的基建底座,这些前沿库对任何一个开发者都将不起作用。他详细介绍了主攻医疗的MONAI、主攻天气的Earth-2、以及量子计算的cuQuantum库的最新动向,这些库也成为了英伟达在垂直AI领域中最新的落地成果,并围绕着垂直领域的数据信息吸引着大批的开发者加入到CUDA生态中去。
英伟达还推出了AI推理服务软件Dynamo,旨在为部署推理 AI 模型的AI工厂最大化其token收益,据英伟达透露,可将DeepSeek-R1模型生成tokens数量提升30倍以上,每秒处理超30000tokens。
Dynamo拥有GPU 规划器、智能路由器、低延迟通信库以及显存管理器四大部分组成。同时,Dynamo推理平台还支持分离服务,将LLM 不同计算阶段分配给不同的GPU。
目前,已有多家AI创企与英伟达表示了合作意向。AI提供商Cohere计划使用Dynamo为其Command系列模型中的代理式AI功能提供支持;Together AI希望能够通过Dynamo能够动态地解决模型管线各个阶段的流量瓶颈。
此外,英伟达今天还发布具有推理功能的开源Llama Nemotron模型系列,旨在为开发者和企业提供业务就绪型基础,助力构建能够独立工作或以团队形式完成复杂任务的高级 AI 智能体。
结合新发布的Dynamo,英伟达全新Llama Nemotron推理模型,可以使用高级推理技术来改进上下文理解和响应生成,并通过分离服务使得每个阶段可以进行单独的微调和资源调配,从而提高吞吐量并更快地响应用户。
Llama Nemotron模型系列包括Nano、Super和Ultra三种规模。Nano 模型可在PC和边缘设备上提供最高准确性;Super模型能够在单个 GPU 上提供最佳的准确性和最高的吞吐量;而Ultra 模型将在多 GPU 服务器上实现最高代理准确性。
据英伟达透露,与基础模型相比,Llama Nemotron推理模型对多步数学运算、编码、推理和复杂决策能力提供了加强,加强后,模型的精度提高多达20%;与其他领先的开放推理模型相比,优化推理速度达到了5倍。
除了Agentic AI,Physical AI则是以一种巧妙的方式融入到GTC大会之中。
走进展会中心,参会者将会看到一个AI雕塑机器人,这个机器人是人工智能艺术家Emanuel Gollob使用脑电波测量设计,并通过AI进行编排设计的。
在会展旁边,我们还可以看到了一款人形机器人当起了会展顾问,它可以回答参会者有关活动、论坛时间、地点等问题。该人形机器人是由初创公司IntBot开发的。
在主题演讲的结尾,黄仁勋与谷歌DeepMind、迪士尼联手打造的机器人Blue上台互动。据他介绍,Blue拥有两大个人超算,十分聪明。对于黄仁勋的指令,Blue也能够听懂指令及时反馈。尽管Blue是一个双足机器人,但从其表现形态上来看,Blue更像是一个机器狗,主要是提供一定情绪价值。
可以看出在此次大会现场,机器人几乎无处不在。黄仁勋提到具身智能主要有三大挑战有待解决:如何处理数据问题、选择什么样的模型架构以及机器人行业的Scaling Law是什么。
事实上,黄仁勋并没有给出具体的答案,但他通过英伟达的产品布局给出了英伟达自己的思考思路。
英伟达强化提升了世界基础模型Cosmos,引入了开放式、可完全定制的物理AI开发推理模型,让开发者更好地控制世界生成。
Cosmos Transfer可简化感知AI训练,将Omniverse中创建的3D 仿真或真值转换为逼真视频,用于大规模可控合成数据生成。Cosmos Transfer WFM 能够吸收结构化视频输入,如分割图、深度图、激光雷达扫描、姿态估计图和轨迹图等,以生成可控、逼真的视频输出。Cosmos Reason 是一个开放式、可完全定制的 WFM,具有时空感知能力,它使用思维链推理来理解视频数据,并能够预测交互结果,如一个人走进人行道或一个盒子从架子上掉下来。
1X、Agility Robotics、Figure AI、Foretellix、Skild AI和Uber是首批采用Cosmos的企业,可更快、更大规模地为物理 AI 生成更丰富的训练数据。
期望值回落,
英伟达面对自研芯挑战
从本次GTC大会活动现场来看,黄仁勋明显表现得没有2023年那般得意气风发。演讲现场多次卡壳,能够明显感受到,回应关键问题,提到关键产品的时候,黄仁勋稍显紧张。
2025年开年以来,英伟达的市值一路震荡下跌。这其中,有美股大环境的影响,也有DeepSeek的冲击,但更多的则是投资者们对英伟达的期望值逐渐回落,更加理性地看待英伟达的增长曲线。情绪回落后,英伟达的市值也逐渐趋于稳定。
但这并不意味英伟达就放缓了停下推动AI的节奏,相反,2024年,英伟达更加密切地关注前沿AI项目进展。
PitchBook数据显示,英伟达在2024年加大了风险投资力度,参与了44轮人工智能公司融资,较2023年的34轮融资大幅增加。英伟达旗下的企业风险投资基金NVentures也在2024年参与了24笔交易投资。
英伟达投资公司
但新的挑战也在出现。近期,谷歌、亚马逊、Meta等大厂希望自研芯片(如TPU、Trainium)减少对英伟达GPU的采购。据悉,亚马逊通过Graviton芯片节省10%-40%计算成本。不过,这些大厂的自研芯片更多自用,对于软硬件能力差的公司,英伟达仍然是他们最好的选择。
另一方面,受美国出口管制影响,英伟达中国特供版芯片性能大幅缩水,中国公司逐渐转向国产替代或自研芯片。在GPU所涉的数据中心业务上,英伟达中国市场营收在总营收中的占比已从2023财年的19%降至2024财年的约5%。
此外,量子芯片、光子芯片等新的芯片架构正在加速开发与落地,或许新的技术变革将会给英伟达带来新的冲击。