人工智能热潮首先席卷了GPU市场,随后内存需求激增。如今,人工智能热潮正在冲击CPU市场,导致CPU供应短缺和价格上涨,这可能会影响那些希望构建和发布人工智能产品的企业,以及任何其他需要CPU的用户。
SemiAnalysis创始人迪伦·帕特尔近日表示: “过去六个月,我们看到整个云市场的CPU资源都已耗尽。到处都没有足够的容量,这导致了很多不稳定因素。”
例如,帕特尔表示,微软的GitHub版本控制网站最近变得不稳定,使用它的开发者经常遇到错误。这是因为“微软把所有剩余的CPU都卖给了其他人,一部分供内部实验室使用,但更多的是卖给了外部实验室,”他解释说。“他们已经与Anthropic和OpenAI签署了协议,所以他们没有剩余的CPU了。”
帕特尔表示,尽管AWS在过去一年中将CPU产量提高了三倍,但仍然感受到了CPU短缺的压力。亚马逊首席执行官安迪·杰西在致股东的年度信中写道:“……已有两家AWS大客户询问是否可以在2026年购买我们所有Graviton实例容量(Graviton是我们广泛采用的定制CPU芯片)——考虑到其他客户的需求,我们无法满足这些请求,但这足以说明市场需求。”
帕特尔上个月在代托纳计算大会上接受伊万·布拉津的现场采访时发表了上述言论。在采访中,他详细阐述了CPU短缺的原因。
帕特尔表示,CPU在人工智能领域一直扮演着重要角色,曾被用于存储、数据预处理、预训练以及人工智能训练过程中的检查点等任务。“但以前CPU的功能非常有限,”他说道。
到了2025年初,情况发生了变化:推理模型的出现。突然之间,我们拥有了功能更强大的AI模型,而这种能力正在推动对CPU的需求。
他说,现在客户不再使用正则表达式对模型进行简单的检查,而是对模型进行更加复杂的检查。
他说:“你在进行代码单元测试和编译。你在运行代理流程,其中实际上会调用数据库等等。或者你在与一些占用大量 CPU 资源的环境进行交互,例如物理模拟或生物模拟。”
“你不断地涉足越来越复杂的事情,模型输出结果会经过验证,进入强化学习环境,然后再返回并基于此进行训练,”帕特尔继续说道。“而且在过去的几年里,这个循环变得越来越紧密。”
我们一直在关注CPU再次成为热门技术的趋势。我们见证了人工智能处理需求的演变,人工智能推理的重要性已经超过了人工智能训练。我们也看到,针对人工智能推理的两个阶段——预填充和解码阶段——出现了新的服务器架构,这两个阶段的需求截然不同。
我们看到英伟达通过推迟发布七个月前宣布用于人工智能推理的 Rubin CPX GPU 来应对这些变化,转而将芯片投入到其他处理器类型中,包括花费 200 亿美元收购知识产权的 Groq LPU,以及其新的 Vera ARM CPU,该公司指望这两款产品能够推动“推理之王”的经济效益。
上个月,我们见证了Arm Holdings 携其首款芯片AGI CPU强势回归,这款CPU由Arm与Meta联合设计,旨在服务于蓬勃发展的AI推理市场。本月初,芯片制造商d-Matrix收购了GigaIO的数据中心业务,以拓展其除PCI接口AI加速器之外的产品线。就在上周,SambaNova和Intel携手合作,共同打造了一套用于构建大规模可扩展AI推理系统的新蓝图。
虽然 GPU 和其他 AI 加速器在 AI 热潮的第一阶段占据主导地位,使得 GPU 巨头英伟达成为世界上最有价值的公司,但当前阶段的 AI 需要大量的 CPU 来处理大规模运行 AI 推理所带来的各种计算任务。
KeyBanc 分析师 John Vinh 和 Ryan Rosumny 在 1 月份的一份报告中写道,英特尔和AMD 的服务器 CPU 几乎已经售罄,并且正在考虑将价格提高 10% 到 15%。
过去12个月,英特尔的股价上涨了211%,而AMD的股价上涨了169%。虽然英特尔的至强CPU仍然占据服务器市场的大部分份额,但AMD的Eyep CPU取得了长足的进步,目前已占服务器市场41%的份额。
服务器CPU的需求正蔓延至其他领域。据报道,戴尔和惠普等PC制造商正面临家用和办公电脑CPU供应短缺的问题,因为CPU的交货周期已从两周延长至六个月。
在某些情况下,CPU 根本就买不到。“如果钱能解决这个问题,那当然最好,”一家游戏电脑品牌的负责人告诉《日经亚洲》,“我们担心的是,即使我们多花钱,也买不到更多。CPU 短缺的情况日益严重,其严重程度不亚于内存芯片短缺。”
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。