液冷是智算中心必选项么?

随着人工智能计算芯片的热设计功耗(TDP)不断提高,数据中心的散热需求日益增长。以NVIDIA的产品路线图为例,从A100的400-500W,到H100的700W,再到未来B200/GB200系列的1000W以上。与之对应,单个机架的功耗也从25-40kW升至60-140kW。在如此高的功耗密度下,单靠空气冷却已经难以为继。

液体导热效率是空气的30倍,因此液冷成为业界的共识,并在NVIDIA等厂商的推动下加速落地。以NVIDIA的GB200平台为例,低端的NVL36仍可采用液冷和风冷的混合方案,但高端的NVL72由于单机架功耗高达132-160kW,就必须使用纯液冷的液液散热方案了。

11月7日下午15:00,来自华为数字能源润泽科技申菱佳力图等知名企业的技术专家将齐聚IDC圈直播间,共同探讨“液冷是否是智算中心的必选项”这一话题。

图片

市场研究机构Nomura预测,NVIDIA的AI服务器中液冷渗透率将从2024年的8%快速提升到2025年的43%和2026年的47%。这将带动全球AI服务器液冷市场规模从2023-2024年的17亿-121亿新台币,暴增至2025-2026年的1229亿-1292亿新台币。其中,冷板作为最大的细分品类,将占到液冷总市场的40-55%。

作为全球最大的数据中心市场,中国对液冷的需求同样强劲。根据中国信通院数据,2021年中国智算中心市场规模已达1500亿元人民币,预计2025年将突破4000亿元。阿里云、华为云、腾讯云等头部企业纷纷宣布在算力和AI领域投入上千亿元,这将进一步带动液冷等散热技术的国产化进程。

不过,液冷目前仍面临一些挑战,比如前期投入成本高、需要对既有基础设施进行改造、存在漏液风险等。因此业界也在积极创新,研发空液混合散热、双相变液冷等过渡性方案,以便在提升散热性能的同时降低实施门槛。例如Wiwynn投资的创业公司ZutaCore就推出了一种双相变液冷系统HyperCool,号称可在无需改造现有数据中心的情况下将PUE降至1.04。

在这样的背景下,液冷是否是智算中心必选项依然存在一定争议。部分企业认为,虽然液冷在高功耗密度下能显著提升散热效率,但前期高昂的投入成本、对现有基础设施的改造需求以及潜在的漏液风险,使得液冷技术的普及面临不小的挑战。另一方面,随着技术的不断创新,如空液混合散热和双相变液冷等方案的出现,部分业内人士则认为液冷可能会成为一种逐步过渡的解决方案,而非每个数据中心的“必选项”。

中国IDC产业年度大典组委会将于2024年12月19日-20日在北京隆重举办"多元重构 算力跃迁"第十九届中国IDC产业年度大典(IDCC2024)。大会聚焦“智算崛起”“赋能协同”“环球布局”“谁主沉浮”“算力新十年”几大议题模块,旨在探讨算力产业的未来发展方向、技术创新、商业模式变革以及可持续发展路径。携手算力产业精英,共同推动中国乃至全球数字经济的繁荣与发展。目前报名通道已开启,扫描以下二维码即可报名。

图片