大摩:DeepSeek低成本方案对内存行业有何影响 ?如何影响选股?

DeepSeek正在重塑人工智能的故事,表明优化、更智能的软件和开放平台,可以像海量计算能力一样具有变革性。对于内存而言,这可能会影响高带宽内存(HBM)对非云应用程序的需求,从而导致内容大幅减少。

走向廉价化,在中国更加本地化:中国的人工智能模型正变得更小、更高效,并且需要更少的计算能力。在云提供商之外,DeepSeek不是托管在数据中心,而是托管在游戏PC集群或不再需要GPU或HBM芯片的设备中。如果在中国能够以更少的计算部署尖端人工智能模型,那么对利润最高、最昂贵的HBM的需求将会减少,而标准品DRAM芯片便已足够。

潜在的对华新制裁是否有影响?我们逐渐认识到计算能力并不是将技术推向新高度的唯一因素。美国的限制只会减少HBM的潜在市场,并可能加速推动需求转向更便宜的传统存储器。中国GPU制造商,例如摩尔线程、华为昇腾或百度的昆仑万维,现在完全有能力以他们的消费类GPU支持DeepSeek的R1模型。随着AI市场进一步向推理迈进,这将有利于中国AI公司更好地在更加公平的环境中竞争。

对内存的四大影响:

1.更小、更高效的AI计算带来的内容减少--我们估计,如果中国的非云市场继续朝着廉价推理的趋势发展,到2027年HBM的总潜在市场(TAM)可能会减少9%。

2.随着人工智能中的标准品芯片份额的提高,与中国的技术差距缩小,从而导致…

3.更高的周期波动性和回报率,以及…

4.鉴于来自中国的竞争导致可持续增长下降,最终导致估值下调。

与高端市场(海力士)相比,我们更看好定价大幅折价的标准品存储器和边缘AI类股票(三星)。中国的标准品存储器需求正在加速,与HBM4产品开发中的相对差距缩小类似,估值差距也在缩小。

DeepSeek-事半功倍

DeepSeek的成功是中国不断增长的技术自主能力以及技术领导格局进入新时代的标志。前沿大语言模型(LLM)现在足够小,不再需要托管在数据中心--许多企业用户越来越多地使用游戏PC集群或没有GPU或HBM芯片的设备。

中国AI推理市场对DRAM行业有四个潜在影响:

1.含量更低:HBM的使用量和含量减少意味着DRAM产量的供应量将增加三倍,以及随后的供应过剩累积。

2.缩小竞争差距:AI计算内存护城河的缩窄意味着中国可以更快地缩小技术差距。

3.更高的周期性:这是由于更高的大宗商品供应增长,最终会降低ROIC。

4.DRAM股票估值下降:这是整个周期内HBM长期收入增长和可持续利润率下降的结果。

更多AI,更少内存容量

使用老一代内存进行AI推理:如果在中国越来越多地使用更少的芯片和使用旧芯片来运行DeepSeek,那么AVLLM可能并不像描述的那样是硬件密集型产业。相反,创造力和独创性使内存使用效率方面的更多创新成为可能,而不是强行提高访问内存带宽。虽然中国的主要云提供商使用H20芯片来支持DeepSeek,但大多数企业正在使用旧式的显卡(RTX3060便足够)、CPU(AMD传统的7000系列CPU)、图形DRAM(GDDR6X)和最小的NAND闪存(256GB SSDSATA)。

这对内存股有影响,这些股票之所以受到青睐,是因为投资者认为:

1.为了产出这些人工智能模型,公司需要购买非常大量的这些芯片

2.拥有更强大的HBM以实现性能,从而……

3.限制DRAM供应,在没有替代品的情况下提高定价。

图片

降低硬件壁垒。DeepSeek V3在设计时考虑了效率和可扩展性,针对不同的模型变体和部署场景,可提供灵活的硬件要求。DeepSeekR1的DRAM/HBM要求因预期使用情况而异。对于基本推论,具有16-32GB图形DRAM的系统就足够了,但训练至少需要32-128GB DRAM和高端GPU。基于云的解决方案通过预先配置的实例提供灵活性,以实现最佳性能。 Exhibit2 是有效运行DeepSeekV3所需的最低和建议硬件规格的详细细分。

图片

而人工智能继续以更低的成本构建:随着软件驱动效率的提高,人工智能需要的硬件将越来越少。DeepSeek是开源的,因此任何人都可以检查他们的算法在不太先进的芯片上是否足够快。上个月,斯坦福大学华盛顿大学创建了一个人工智能推理模型(S1),成本不到 50 美元,但与尖端的 OpenAl和DeepSeek相当,许多其他学术机构和公司都使用了DeepSeek推向市场的蒸馏技术(在不牺牲性能的情况下,将大型AI模型压缩为更小、更高效的版本)。人工智能的最终用户对价格敏感(如果要与人类劳动力竞争,人工智能需要相对便宜)

DeepSeek正在进一步利用软件的力量,寻找利用手头可用硬件的解决方法。DeepSeek的最新开发成果--FlashMLA--已经成功在Hopper H800上实现了580 TFLOPS的BF16矩阵乘法,大约是行业标准评级的八倍。此外,凭借高效的内存利用率,FlashMLA可实现高达3000GB/s的内存带宽,几乎是H800理论峰值的两倍。

这里重要的一点是,所有这一切都可以仅通过代码实现,而不是硬件增强或更多的HBM。简而言之,通过将数据分解为更小的部分以实现更快的处理,仅FlashMLA就可以将内存消耗降低高达40-60%。

图片

量化DeepSeek的低成本存储器采用率

HBM总潜在市场敏感性分析:如果我们假设企业和其他非超大规模服务提供商将逐渐用工作站和边缘推理取代他们的服务器集群,作为基础设施优化工作的一部分,这意味着HBM总潜在市场与我们的基准情境相比有所下降。

我们根据基准情境及以下额外假设构建敏感性分析:

根据我们大中华区半导体团队对AI半导体市场的预测,我们假设推理通用图形处理器(GPGPU)/专用集成电路(ASIC)的比例将在2024年至2027年逐渐增加。根据 Gartner 预测,2025-27 年中国将占全球AI支出的 13-14%。

我们假设超大规模云服务商对AI推理服务器的使用保持不变。根据Gartner的数据,超大规模云服务商占AI服务器需求的75-80%。我们假设到2027年,中国其余市场的40%(主要是企业和其他服务提供商)将逐步部署边缘推理。

因此,我们预计到 2027年,HBM的总使用量将下降 8%,而这种情境下的HBM总潜在市场到2027年将达到610亿美元,比我们的基准情境低 8%。我们对HBM的基准情境假设:Memory-FalseDawn,NoRecovery(2025年2月20日)

图片

图片

图片

对选股的影响

目前战术性交易:市场展望未来6-9个月(投资者希望先发制人)故事的后半部分,即DRAM价格将在2025年第二季度触底(我们目前还看不到这种迹象)。DRAM现货价格的飙升是受到在美国征收关税之前大量需求前置的拉动,这种情况不太可能持续到2025 年第二季度。

在我们的基准情境下,HBM不是2025年EPS大幅上升的推动因素,因为主要供应商在2025年的产能已经售馨(即没有上涨空间),并且标准品DRAM合同价格在2025年第二季度或之前仍将承压,目前定价谈判的能见度有限。

2025年下半年的预期复苏可能会受到预期加征关税(欧盟、中国)带来的增长恐慌的影响,且我们也已指出HBM的供应不再紧张。此外,这已经是市场寄希望于--并且需要验证--智能手机和个人电脑在下半年出现复苏的第三年。

HBM的估值假设HBM在过去几年的竞争状态将持续一段时间,并且是持续的而非周期性的。如果先进人工智能的采用与低廉得多的内存硬件相结合(GDDR6对比HBM),那么这些假设的合理性就会存疑。如果能够以更低的成本打造类似的人工智能,则最终可能会缩短资本支出周期--那问题将不再是2025年HBM收入继续增长的速度,而变成其可能放缓的程度。