黄仁勋对话高盛CEO全文:英伟达必要时可以弃用台积电

图片
北京时间 9 月 11 日周三晚,英伟达 CEO 黄仁勋在高盛组织的一场科技对谈中告诉高盛 CEO 所罗门,英伟达将在第四季度扩大产能,明年继续扩大。
黄仁勋表示,客户对 Blackwell 的需求实在太大了,每个人都想成为第一个拥有它的公司,每个人都想拥有最多的产能,每个人都想领先。他还特别提到英伟达在算法优化和架构一致性方面的优势,能够大幅提升客户的总拥有成本和竞争力。
对 AI 芯片需求巨大的言论同时间刺激了英伟达的股价,美股早盘英伟达一度转跌至 107 美元,伴随黄仁勋的讲话收盘至 116.9 美元,大涨 8.15%,增加 2158 亿美元市值,折合人民币 1.5369 万亿元。
黄仁勋强调,随着摩尔定律的终结,通用计算已经到达瓶颈,未来的关键在于加速数据中心,提升其密度和能源效率。
他预计全球将价值数万亿美元的通用数据中心会逐渐被加速计算中心所替代。通过加速SQL处理和推荐系统等核心任务,企业将实现显著的性能提升与成本节约。
未来的计算不仅局限于数据处理,还将扩展到技能增强领域。黄仁勋认为,生成式 AI 技术的应用将改变工作方式,数字助手和 AI 工具将成为各个领域不可或缺的伙伴,从而进一步推动产业生产力的提升。
他还预测,AI 计算领域的创新速度将继续加快,通过开发多种芯片与技术组合,英伟达将每两年实现性能的大幅提升,持续保持其在市场中的领导地位。
以下为这场对话的完整内容,enjoy~

所罗门:

自从你在 1993 年创办英伟达以来,你一直是加速计算的先锋。公司在1999年发明的 GPU ,推动了 PC 游戏市场的增长,重新定义了计算机,并点燃了现代 AI 时代。Jensen拥有俄勒冈州立大学的学士学位和斯坦福大学的硕士学位。

我想从 31 年前说起,当时你创立了公司。从一家以游戏为中心的 GPU 公司,转型为如今提供广泛硬件、软件服务于数据中心的企业。

我想请你谈谈这一旅程的点点滴滴。当你刚开始时,你是怎么想的,这一路上公司是如何演变的?这是一次非常不凡的旅程。或许你可以顺便谈谈,展望未来时你们的关键优先事项,以及未来的方向。

黄仁勋:

我想我们当时做对的一件事,是我们有一个愿景,那就是会有一种新的计算方式,能够补充通用计算的不足,去解决通用计算器永远无法解决的问题。

而这种处理器最开始是从计算机图形学这个对 CPU 来说极其困难的任务着手的,但我们知道它最终会扩展到其他领域。

我们选择的第一个领域是图像处理,它是对计算机图形学的一个补充。接着我们扩展到物理模拟,因为在我们选定的视频游戏应用领域,你不仅需要美丽的图像,还需要动态效果来创造虚拟世界。

我们一步步地前进,将其带入科学计算领域。我们最早的一些应用是分子动力学模拟,另一个是地震处理,基本上是逆物理学。地震处理与 CT 重建非常相似,都是另一种形式的逆物理学。我们就这样一步步前进。

我们对相邻行业和互补算法进行了思考,逐步解决问题。但从那时起的共同愿景,就是加速计算可以解决有趣的问题。

如果我们能够保持架构的一致性,意思是,今天开发的软件可以在你留下的较大算力基石上运行,而过去开发的软件可以通过新技术进一步加速。这种关于架构兼容性的思维方式,从 1993 年开始,我们一直坚持到今天。

这也是为什么英伟达的 CUDA 拥有如此庞大的安装基础。因为我们始终保护它,保护软件开发者的投资,这自始至终都是我们公司的首要任务。

展望未来,沿途我们学到了很多,比如如何成为一个创始人,如何当 CEO ,如何经营公司,如何建立公司,不仅仅是这些。这些都是新的技能。我们还学会了如何发明现代计算机游戏行业。

很多人不知道,英伟达是世界上最大的游戏架构安装基础。GeForce 拥有约 3 亿游戏玩家,增长势头依然非常强劲,充满活力。

所以每次我们进入一个新市场时,我们都需要学习新的算法,了解新的市场动态,创造新的生态系统。我们之所以要这样做,是因为与通用计算器不同,如果你构建了一个加速处理器,那么一切不会自动运作。作为加速计算器,你需要问自己:该加速什么?因为没有一种通用的加速器。

所罗门:

深入探讨一下,谈谈通用计算和加速计算之间的区别。

黄仁勋:

如果你看看软件,从你编写的庞大软件中,会发现很多涉及文件输入输出的部分、数据结构的设置以及一些包含魔法般的核心算法的部分。

这些算法因应用领域而异,无论是计算机图形学、图像处理还是其他任何领域。它可以是流体力学、粒子系统,或者像我提到的逆物理学,甚至是图像处理领域的东西。这些不同的算法都有所不同。

如果你创建了一个处理器,它在这些算法上表现得特别出色,并且能够补充 CPU 的不足( CPU 能做的事情,它就擅长做),那么理论上你可以极大地加速一个应用程序。

原因在于,通常情况下,5%~10% 的代码会占据 99.99% 的运行时间。所以如果你将那 5% 的代码卸载到我们的加速器上,那么理论上你就能将应用程序加速 100 倍。这种情况并不少见,我们确实经常做到。

例如,我们将图像处理加速 500 倍。如今我们也处理数据处理,这是我最喜欢的应用之一,因为几乎所有与机器学习相关的东西,都是数据驱动的,而数据处理正是其中的核心部分。

无论是 SQL 数据处理、 Spark 类型的数据处理,还是矢量数据库处理,所有这些都涉及到结构化或非结构化的数据处理,也就是数据框架的处理。

我们将这些处理过程加速了非常多,但要做到这一点,你必须创建相应的库。例如,在计算机图形学中,我们很幸运有像 OpenGL 和微软的 DirectX 这样的图形库。但在这些之外,几乎没有现成的库可用。

于是我们创建了自己的库,比如我们最著名的库之一,类似于 SQL 这样的库。SQL 是存储计算的一个库,我们创建了一个叫做 CuDNN 的库,它是世界上第一个神经网络计算库。

我们还有 CuOpt 用于组合优化,CuQuantum 用于量子模拟与仿真,还有像 CuDF 这样的库,用于数据框处理(类似于 SQL )。

所有这些库都需要我们去发明。我们需要重构应用中的算法,使其能在我们的加速器上运行。如果你使用这些库,那么你就可以获得 100 倍的加速,甚至更多。

这一理念非常合理,但问题是如何去发明这些算法,并让整个视频游戏行业使用它?如何让整个地震处理和能源行业使用它?如何让整个 AI 行业使用它?你明白我的意思吗?

我们必须首先进行计算机科学研究,然后进行生态系统开发,并且说服大家使用它。与此同时,我们还得确保这些库能在所有不同的计算机上运行。我们就是这样,一个接一个地跨越领域。

我们为自动驾驶汽车创建了丰富的库,为机器人技术开发了出色的库,还有用于虚拟筛选、无论是基于物理学的虚拟筛选还是神经网络的虚拟筛选的库。我们甚至还有专门的气候科技库。

所以我们一个领域一个领域地发展,结交朋友,创造市场。英伟达真正擅长的,就是创造新的市场。

我们已经做了这么久,似乎加速计算已经无处不在,但实际上,我们是在一个领域接一个领域地攻克。

所罗门:

我知道在场的许多投资者都非常关注数据中心市场。会很有意思听听你的观点,以及公司的长期和中期机会。显然,你所在的行业正推动着下一次工业革命。你觉得行业面临的挑战有哪些?谈谈你如何看待数据中心市场的发展吧。

黄仁勋:

有两件事同时发生,这两者常常被混淆,我们需要把它们拆解开来讨论。首先,让我们假设没有 AI 存在。

在一个没有 AI 的世界里,通用计算已经到达了瓶颈。大家都知道,摩尔定律和晶体管的微缩以及等功率下性能提升或等成本下性能提升的时代已经结束了。

未来,我们不会再看到每年性能翻倍的 CPU 。我们很幸运能在 10 年内看到性能翻倍的情况。

过去的摩尔定律是每 5 年性能提升 100 倍,每 10 年提升 1000 倍。我们只需等待 CPU 变得更快。然而,如今这个时代已经结束了,我们正进入一个计算膨胀的时代。

所罗门:

现在,随着摩尔定律的终结,我们正经历计算膨胀。

黄仁勋:

所以我们需要做的,就是尽可能地加速一切。无论是 SQL 处理,还是任何形式的数据处理,尤其是如果你创建了一家互联网公司,有一个推荐系统,那它绝对需要被加速。现在这些系统已经完全加速了。

几年前它们还都在 CPU 上运行,但如今,世界上最大的推荐系统这种数据处理引擎已经全都加速了。所以,如果你有推荐系统或搜索系统,或者是任何大规模数据处理系统,你必须加速它们。

接下来会发生的第一件事,就是世界上价值数万亿美元的通用数据中心将被升级为加速计算型数据中心。这一定会发生。这是必然的事情。

原因之一是我们已经到了必须要做出改变的阶段。你会看到的第一个动态是计算机的密度增加。你知道,这些巨大的数据中心非常低效,因为它们充满了空气,而空气是电的不良导体。

我们想做的是,将这些原本可能占用 50、100 或 200 兆瓦的大型数据中心,压缩成一个非常小的数据中心。如果你看看我们的一些服务器机架,英伟达的机架可能看起来很昂贵,可能每个机架花费几百万美元,但它可以替代成千上万个节点。

令人惊讶的是,光是连接旧的通用计算系统的电缆成本,可能比用一个高密度的机架来取代这些旧设备的成本还要高。

而高密度化的另一个好处是,一旦你达到了这种高密度,你就可以进行液冷处理,因为冷却一个巨大的数据中心很难,而冷却一个小型数据中心要容易得多。

所以我们现在的首要任务是加速和现代化数据中心,增加其密度,使其更加节能。你能节省资金、节省能源,并且效率大大提高。

这是我们接下来 10 年要专注的事情。现在,当然还有一个第二动态。由于英伟达的加速计算带来了巨大的成本节约,在过去 10 年里,计算能力不仅提高了 100 倍,而是提高了 100 万倍。

因此,问题变成了:如果你的速度快了一百万倍,你会做什么不同的事情?突然之间,人们说,“嘿,为什么我们不让计算机自己编写软件,而不是我们试图去确定功能或算法呢?我们只需要把所有数据、所有预测数据交给计算机,让它自己去找到算法。”

我们在如此大规模的不同数据领域上进行了这种操作,以至于现在计算机不仅能够处理数据,还能理解数据的意义。因为它能够同时理解多种模态,所以它可以进行数据翻译。

我们可以从英语翻译为图像,图像翻译为英语,英语翻译为蛋白质,蛋白质再翻译为化学分子。因此,因为它能够同时理解所有数据,它现在能够进行这些我们称之为生成 AI 的翻译操作。

可以从大规模文本生成小规模文本,也可以反过来进行文本生成,现在我们进入了一个计算革命的时代。

令人惊叹的是,第一批价值数万亿美元的数据中心已经能够被加速了。我们在 AI 中发明了这种新的缓冲技术,这种 AI 革命不仅是一种工具,更是一种技能。

这就是为什么现在创造了一个全新的行业。因为,如果你回顾整个 IT 行业,直到现在,我们一直在制造人们可以使用的工具和仪器。而这一次,我们将要创造的是能够增强人的技能。

这就是为什么人们认为, AI 将不仅仅局限于数万亿美元的数据中心,还将扩展到技能领域。

那么,什么是这种技能呢?首先是数字化技能,比如一个数字化装配线机器人,或者是数字化客户服务机器人,又比如说,一个数字化的可视化员工,专门负责计划和规划业务。

它也可以是一个数字化的 SAP 代理。我们公司使用很多ServiceNow服务,我们甚至有数字化的员工服务。因此,现在我们拥有了这些数字化的“人类”,这就是 AI 的工作方式。

所罗门:

让我们稍微退一步,换个角度思考一下。基于你刚刚说的所有内容,目前金融市场上有一个持续的争论,那就是我们是否能够在构建 AI 基础设施时,获得足够的 ROI。

你如何评估当前周期中客户的投资回报率?如果我们回顾一下云计算,在它们采用周期的类似阶段,投资回报率是如何表现的?我们现在所处的位置与当时相比如何?

黄仁勋:

在云计算之前,虚拟化是主要的趋势,还记得吗?虚拟化基本上是将数据中心中的所有硬件虚拟化为一个虚拟数据中心。

然后我们可以在整个数据中心中移动工作负载,而不是将其直接与特定计算机关联。因此,数据中心的利用率得到了改善。

通过虚拟化,数据中心的成本减少了一半甚至更多。在此基础上,我们将这些虚拟计算机推向云端,多个公司可以共享同一资源,进一步提高了利用率。

过去10到15年间,虚拟化和云计算的发展掩盖了底层发生的一个根本性变化——摩尔定律的终结。虚拟化和云计算带来了显著的成本节约,但它掩盖了晶体管缩放和 CPU 性能增长的终止。

现在,随着这些成本节约的效应逐渐减弱,我们看到的是数据中心和计算的膨胀。因此,第一件发生的事情就是加速计算。

如今,你可以在云端使用英伟达的加速器进行数据处理,比如 Spark ,这是当今世界上最常用的数据处理引擎之一。如果你使用 Spark 并在云端使用英伟达加速器,通常能看到 20 倍的加速效果。

因此,你可以节省大量计算时间,尽管计算成本会稍微增加,但整体回报率非常可观。这就是加速带来的直接ROI。

接下来是生成 AI 的第一波浪潮。在这一阶段,像我们这样的基础设施提供商和所有云服务提供商将基础设施部署到云端,让开发者可以使用这些机器训练模型或进行模型微调。

这带来了非常好的回报,因为需求非常强劲。每一美元的支出,都能带来五倍的收益。这种情况正在全球范围内发生。

像我们熟知的一些应用,例如 OpenAI 的 ChatGPT,或者像 Github Copilot 这样的工具,它们带来的生产力提升是惊人的。

如今,我们公司的软件工程师几乎都在使用这些生成工具,不论是我们自己开发的工具,还是使用 C++ 和 CUDA 进行协同生成。

未来,每个软件工程师都将有一个数字化工程师作为助手,24 小时全天候协助他们工作。这是未来的趋势。

我们公司有 32000 名员工,但我们希望通过数字化工程师将这个数字增加到 100 倍。很多行业已经在积极拥抱这一趋势。

在我们的公司, AI 已经成为计算机图形学中的重要工具。我们现在通过计算一个像素并推断出其余的 32 个像素来完成图像生成,这样可以显著节省能量和计算时间。

如果没有 AI ,我们无法支持自动驾驶行业,也无法完成机器人技术和数字生物学的研究。几乎所有的科技生物公司都在使用 AI 进行数据处理,甚至进行蛋白质生成和虚拟筛选。整个新药发现过程因为 AI 而被重新发明,这让人非常兴奋。

所罗门:

现在,让我们谈谈你的竞争优势。显然,有一些公共和私营公司在试图挑战你的领导地位。你如何看待你们的竞争壁垒?

黄仁勋:

首先,有几件事使我们与众不同。首先要记住, AI 不仅仅是关于硬件, AI 更是关于基础设施。如今的计算机不仅仅是制造芯片然后出售。

构建 AI 计算机并不是简单地组装芯片,而是构建一个完整的数据中心。比如我们的 Blackwell 系统,它由七种不同类型的芯片组成, Blackwell 只是其中之一。

所罗门:

对,跟我们谈谈 Blackwell 。

黄仁勋:

当你想构建 AI 计算机时,大家可能会提到“超级集群”或“超级计算机”这样的词汇,因为这不仅仅是芯片或一台计算机,而是整个数据中心的构建。

如果你看看这些超级集群,想象一下运行它所需的软件吧。现在没有微软的 Windows 来运行这些系统,每个系统的软件都是完全定制的。

设计芯片的公司,也会设计这个超级计算机及其所有的软件。因此,拥有一个完全优化、更加高效和节能的系统是很有意义的。

其次, AI 涉及到算法,而我们非常擅长理解算法的需求以及如何在数百万个处理器之间分配计算工作,确保计算能够长时间稳定运行,同时实现极高的能源效率和快速的任务完成。这是我们特别擅长的领域。

最后, AI 是关于计算的,而计算的关键是安装基础。拥有相同的架构,无论是在云端还是本地,无论是在超级计算机、机器人或个人电脑上运行,拥有能够运行相同软件的统一架构非常重要。

这种一致性是我们过去 30 年坚持的原则,也是为什么如果你今天要创建一家公司,最明显的选择是使用英伟达架构的原因。

我们的架构无处不在,无论你选择什么计算设备,只要有“英伟达 Inside”,你就知道它能够运行你所需要的软件。

所罗门:

你们的创新速度非常快,我想请你谈谈 Blackwell 。它的训练速度提高了四倍,推理速度比前代 Hopper 快了30倍。你们似乎在以惊人的速度创新,你觉得能维持这样的快节奏吗?当你考虑到你们的合作伙伴时,他们如何跟上你们这种快速的创新步伐?

黄仁勋:

我们的创新节奏基于这样一个基本方法:我们每次都会开发七种不同的芯片。每种芯片的更新周期大约是两年,我们可以在每年给它们一个中期提升。

但如果你每两年推出一个全新架构,那就相当于在光速前进。我们有七种不同的芯片,它们都为性能做出贡献。

因此,我们每年都可以推出一个比上一代更好的 AI 集群或超级集群,因为我们有很多不同的组件可以进行优化。

这种规模的性能提升直接转化为客户的总拥有成本(TCO)。例如, Blackwell 的性能是前代产品的三倍,如果某个客户有1吉瓦的电力预算,那么他们的收入也会增加三倍。

这种性能提升转化为吞吐量,而吞吐量转化为收入。对那些有固定电力预算的客户来说,这意味着三倍的收入增长。没有任何其他成本节约措施能弥补这种收入增长。

因此,通过集成所有这些不同的组件并优化整个堆栈和集群,我们能够为客户提供更高的价值。

同样地,对于客户想花费的任何金额来说,性能的提升意味着成本的降低。我们拥有最好的每瓦性能(即收入),也拥有最好的总拥有成本(TCO),这意味着更好的毛利率。

我们在市场上不断推动这些创新,客户能够持续受益。而且由于我们的架构是兼容的,昨天开发的软件明天仍然可以运行,今天开发的软件可以在整个安装基础上运行,这让我们能够非常快地前进。

如果我们每次更换架构,这种速度是不可能实现的。搭建系统本身就需要一年时间。而我们之所以能这么快,是因为我们将所有组件整合在一起。

有人曾发推文说,在我们发货后的19天内,他们已经让一个超级集群上线并运行了。你不可能用一年时间拼凑出这么高效的系统。

因此,我认为我们将创新的速度转化为客户的收入增长和毛利提升,这是非常了不起的。

所罗门:

你们的大部分供应链伙伴都在亚洲,尤其是台湾。在当前的地缘政治背景下,你是如何看待这一情况的?

黄仁勋:

亚洲的供应链确实非常庞大且相互交织。人们常常认为,当我们提到 GPU 时,就好像只是一个小芯片。其实,英伟达的系统有 35000 个零件,重达 80 磅,消耗 10000 安培电流。

安装起来后,整个系统重达 3000 磅。这个 GPU 系统非常复杂,构建它就像制造一辆电动汽车一样。我们设计了尽可能多的多样性和冗余机制,以确保供应链的稳定。

在必要时,我们拥有足够的知识产权,能够在不同供应链之间灵活切换。或许某些生产技术不如最佳选择,可能性能和成本无法保持在同一水平,但我们仍然能够提供可行的解决方案。如果真的发生任何突发情况,我们能够快速调整供应链。

我们之所以与台积电合作,是因为它是世界上最优秀的,不仅是优秀,而是绝对领先。它有着悠久的合作历史,具备极高的灵活性和扩展能力。

去年,英伟达的收入经历了爆炸式增长,而这离不开供应链的支持。台积电和供应链的快速响应能力令人难以置信。

在不到一年的时间里,我们大幅增加了产能,明年还会继续扩大。这种敏捷性和应对能力是我们选择台积电的原因。但如果有必要,我们当然也可以选择其他供应商。

所罗门:

是的,公司确实处于非常有利的地位,我们讨论了很多好事。那么,你最担心的是什么?

黄仁勋:

嗯,我们公司目前正在与世界上所有的数据中心合作。我现在找不出一个我们没合作的数据中心、云服务提供商或计算机制造商。

所以,这意味着我们肩负着巨大的责任。很多人都依赖我们,大家对我们的期望很高。需求非常旺盛,交付我们的组件、技术、基础设施和软件对很多人来说是情感上非常重要的事情。因为这直接影响到他们的收入,直接影响到他们的竞争力。

因此,今天我们可能有更多情感投入的客户,他们非常需要我们的产品,情绪高涨。

我们可以感觉到所有人都在等着我们来满足他们的需求,而一旦我们交付了这些产品,这种情绪就会消失。但现在的情绪非常激烈,压力也很大。

我们肩负着很大的责任,努力做到最好。我们正在全力以赴地推动 Blackwell 的生产,现在已经全面投入生产。

我们将在第四季度发货,并在第四季度扩大产能,明年继续扩大。对 Blackwell 的需求实在太大了,每个人都想成为第一个拥有它的公司,每个人都想拥有最多的产能,每个人都想领先。

因此,这种紧张感真的非常强烈。我觉得,能够发明下一个计算时代是非常有趣的,看到这些惊人的应用程序被创造出来很令人振奋,看到机器人到处行走也很令人兴奋,看到这些视觉化的代理人作为一个团队在你的计算机上解决问题是很惊人。

同时,我们用 AI 设计芯片,然后用这些芯片运行我们的 AI ,这一切都非常了不起。但其中真正紧张的部分,就是我们肩负着世界的期望。