1.英伟达创始人CEO黄仁勋在GTC年度技术大会上推出新一代芯片,以应对人工智能市场的转变。
2.黄仁勋表示,2026年推出的Rubin芯片后,该公司还将在2028年推出未来一代费曼芯片。
3.由于代理式人工智能和推理的出现,人们需要的计算量将比去年这个时候认为的要多100倍。
4.然而,英伟达在推理芯片方面面临更多的竞争,最近中国人工智能初创公司DeepSeek发布了一款低成本的AI推理模型。
5.为加速推理过程,英伟达还发布了一款名为Dynamo的新软件,并向用户免费提供。
以上内容由腾讯混元大模型生成,仅供参考
当地时间3月18日,英伟达创始人CEO黄仁勋在该公司的GTC 年度技术大会的主题演讲中宣布推出用于构建和部署人工智能模型的新一代芯片。
黄仁勋称英伟达的GTC为AI“超级碗”。他当天身穿黑色皮衣和牛仔裤,向台下观众展示了该公司今年晚些时候即将推出的升级版AI芯片Blackwell Ultra以及将于明年推出的下一代AI芯片Vera Rubin。
英伟达每隔一年就会推出一代芯片。黄仁勋称,在2026年推出Rubin芯片后,该公司还将在2028年推出未来一代费曼芯片。这些芯片都以物理学家的名字来命名。
自2022年底OpenAI发布ChatGPT以来,彻底引爆了英伟达AI芯片的需求,该公司过去两年多的销售额增长了超过六倍,AI芯片主导了人工智能训练芯片的大部分市场。
而随着人工智能市场从“训练”转向“推理”——即在大量数据上训练聊天机器人等人工智能模型以使其变得智能转向模型利用其智能为用户提供答案,企业正在从训练人工智能模型转向从模型中获取详细答案,英伟达的利润丰厚的芯片业务也面临着技术变革的压力。尽管该公司占据了人工智能训练市场约90%的芯片份额,但在推理芯片方面面临更多的竞争。
最近,中国人工智能初创公司DeepSeek 发布的一款低成本的AI推理模型使用了更少且不那么先进的英伟达芯片,产生了可与ChatGPT等最先进AI模型类似的效果,进一步增加了投资者对英伟达芯片需求的质疑。
软件开发人员和投资者正在密切关注该公司的新一代芯片能否提供足够的额外性能和效率,以说服包括微软、谷歌和亚马逊在内的云计算大客户们继续花费数十亿美元建立基于英伟达芯片的数据中心。
黄仁勋在发布会上努力捍卫该公司芯片在人工智能行业中的地位。他表示:“由于代理式人工智能(agentic AI)和推理的出现,人们需要的计算量将比去年这个时候认为的要多100倍!”
代理式人工智能指的是在日常任务中几乎不需要人工干预的自主人工智能代理。“在过去2到3年里,人工智能取得了重大突破,我们称之为agentic AI。”黄仁勋说,“它可以推理如何回答或如何解决问题。”
黄仁勋强调,英伟达处于有利地位,可以应对人工智能行业的转变。去年,英伟达的AI芯片销售占据了该公司超过1300亿美元收入的大部分。
“英伟达的芯片有两个主要用途:帮助AI系统智能地响应大量用户,并在最快的时间内响应。”黄仁勋表示,“英伟达的芯片是唯一能够同时实现这两个目的的芯片。”
他还说道,升级版Blackwell Ultra芯片更适合推理模型。“英伟达开发了更高效的芯片进行推理,因此当新推理模型在部署时需要更多计算能力时,英伟达的芯片将能够处理。”黄仁勋解释称。
为了加速推理过程,英伟达还发布了一款名为Dynamo的新软件,并向用户免费提供。
黄仁勋称,目前上市的Blackwell GPU实际上是两个独立的芯片,它们被组装在一起并作为一个芯片工作。从Rubin开始,英伟达将两个或多个芯片组合成一个芯片。到2027年下半年,英伟达计划发布的Rubin Next芯片将四个芯片组合成一个芯片,速度也将实现翻倍。
该公司在媒体吹风会上表示,该芯片每秒将能够产生更多token,这意味着可以在相同的时间内与前代产品相比生成更多内容。
黄仁勋还宣布推出一款基于Blackwell芯片的新型个人电脑,名为DGX Workstation,并表示这款电脑将由戴尔、联想和惠普等公司生产。这款设备预计将对苹果的一些高端Mac电脑构成挑战。