当 DeepSeek 掀起 AI 领域的惊涛骇浪,这场革命的余波早已荡向能源领域!数据中心的 “耗电大户” 们绷紧神经 —— 高效模型究竟会给能耗带来怎样的 “化学反应”?是开启节能新纪元,还是引发新一轮电力风暴?本文将从需求、技术、产业以及算力-电力协同角度层层剖析,解锁这场 AI 与能源碰撞的 “谜题”!
导 读
ChatGPT 等AI大模型的出现,推动了对算力的巨大需求,数据中心的能耗在过去几年中大幅飙升。而近期以 DeepSeek 为代表的高能效模型的出现,凭借其在算法、架构等方面的优势,对AI行业产生了可谓革命性的影响。那么,数据中心行业未来能耗需求将呈现怎么样的变化?已成为能源专业人士和政策制定者关注的核心,也是数据中心可持续发展重点关注的话题。如图1所示,本文试图从普惠算力、规模变革、能源效率以及算电协同等角度分析和预见高能效模型对数据中心未来发展的潜在影响。
图1 数据中心能耗增长趋势及其驱动力
以DeepSeek为代表的高能效模型究竟会给能耗带来怎样的 “化学反应”?具体分析如下:
1)激发普惠算力需求。技术进步提高了能源利用效率并降低了成本,这会大大刺激数据中心市场消费的增长,刺激数据中心基础设施进一步扩张。一是大模型在垂直领域如医疗、制造等行业正处于爆发式发展阶段,多场景的训练和推理需求或将呈现指数级增长;二是高能效模型显著降低了大型模型的边际算力门槛,将先前由“算力高墙”阻隔的算力市场需求释放出来,为更多初创企业和科研机构提供了进入 AI 赛道的机会。
2)降低单体智算规模。得益于算法与系统架构的创新,高能效模型能够以更少的服务器和更低的能耗实现较高性能,有效减少对大型数据中心的依赖,这将促使行业重新评估数据中心的规划与设计。实际上,DeepSeek 等模型已经可以在消费级硬件甚至笔记本、边缘服务器上高效部署,实现本地化推理与离线服务。集中式与边缘化协同的计算架构在未来将更为普遍,相对于集中式数据中心规模增长的暂缓,边缘计算的单体智算规模或将快速上升。
3)减缓能效水平提升。高能效模型可以降低数据中心对GPU的要求,而中低端服务器的功耗比通常低于高端服务器,散热密度也会更低,这使数据中心可继续沿用风冷方式进行冷却,而不必引进更高成本但是更高效的液冷方式,数据中心的整体能效提升或将放缓甚至下降。同时,随着对边缘小型数据中心需求的增大(小型数据中心的PUE通常更高),尽管高效模型可以减少单位任务的能耗,但短期内可能会减缓数据中心整体能效的提升。
4)促进算力电力协同。高能效模型降低了数据中心IT设备的部署成本,运营电费支出在数据中心全生命周期总投资中的占比或将进一步提升。电力市场发展引发电价波动及峰谷差异会直接影响数据中心的运行模式,这或将推动数据中心运营商根据业务时空需求特性及电力市场价格信号,实施需求响应与灵活调度。同时,在算力市场使用“一度算力(或1kWh算力)”等概念来规范算力结算标准,实现按需算力分配,有助于促进算电协同模式的广泛应用,助力数据中心和新型电力系统的协同发展。
总结与展望
综上,笔者认为在 DeepSeek等高能效模型的推动下,全球数据中心电力需求或将呈现更快速的增长趋势。高能效模型通过算法与架构的创新,优化了模型性能及成本,但不可避免地引发了更高的资源和能耗需求,表现在激发市场普惠算力需求、边缘计算容量上升以及减缓数据中心能效提升等方面。同时,在算力普惠的浪潮中,推动算电协同、算热协同等新模式以在提升算效和降低能耗之间实现动态平衡至关重要。
责任编辑
秦文建 中国科学院深圳先进技术研究院
田博博 华东师范大学