这个夏天,天气版「山东卷」考验电网,达摩院气象大模型成功通关

机器之心原创

机器之心编辑部

2024 年是极端天气事件高发的一年。

3 月,江西南昌持续遭遇强对流天气,大树被连根拔起,民宅玻璃被吹落;9 月,上海的小伙伴在一周之内迎来了两次台风,高呼「活久见」。十一假期之前,内蒙古呼伦贝尔突降暴雪,前去「赏秋」的游客被打得措手不及。

图片

而且,Nature 子刊的一篇文章显示,在未来的 20 年,这种极端天气有迅速加强的趋势。

图片

其实,对「风云突变」的威力,有些行业早就深有感受,甚至是深受其苦。电网就是这样一个场景。无论是从发电端还是用电端来看,天气的剧烈变化都会直接影响电力供需平衡,给电网运行带来意想不到的挑战。

好在,AI 正在上岗天气预报员,带给电力系统高频更新的专属天气预报。

在国网山东电力调控中心,一个名叫「八观」的气象大模型已经运行了好几个月,以每小时公里级的精准度成功预测了多次极端天气,帮助电网平稳度过了一个「旱涝急转」的夏天。

从数据来看,它的准确率明显高于基线系统。

图片

这位优秀的 AI 天气预报员是什么来头?在 11 月 6 日北京举行的达摩院决策智能产品发布会上,相关谜底被揭开。

当电网遭遇「风云突变」

今天夏天,家住山东的朋友或许都感受到了天气的反常:先是高温持续、旱情严峻;紧接着旱涝急转、暴雨频发。

我们想象一下小学应用数学题里一边注水一边放水的泳池。电网就像这个泳池,一边在发电,一边在用电,而且「水位」要始终保持平衡。

但天气一变,平静的「水面」要不起波澜就难了。

先说用电侧。最直观的,下雨前天气闷热,更多的居民会选择开空调。温度每升高一度,对应的用电量,专业上叫做「负荷」就会相应增加。但如果雨下下来,天气一凉爽,用电负荷就会骤降。

图片

偏偏今年夏天山东降雨特别多,是有数据统计以来第二多的。8 月 25 日至 28 日,山东的气温就因为降水出现大幅度波动,电网负荷总量在 3 日之内下降了 20%。

要知道,电网在高负荷状态下需要维持充足的电力供应以避免停电风险,而突如其来的需求减少可能导致电力过剩,引发电压不稳定、频率波动等问题

再说发电侧。和传统的火力发电不同,风电、光伏「看天吃饭」,发电功率随天气变化而波动。尤其这类新能源发电装置多是分布式的,受区域天气影响很大。新能源装机、并网规模不断攀升,给电网注入了更多随机性、波动性和间歇性因素。

这样一来,天气一变,电网就会两头承压。要是来不及制定合理的调度策略,牵一发而动全身,就有可能调度失衡。

据统计,我国新能源装机占比已经超过 40%。要保证大规模的分布式光伏和风电安全稳定地接入电网,高频、高精度的区域天气预报变得尤为关键

图片

「八观」气象大模型的落地之路

运行在国网山东电力调控中心的「八观」是由阿里巴巴达摩院决策智能实验室开发的一个气象大模型。这也是八观上岗的第一份「工作」。根据这份工作的需求,它不仅需要提供天气预报,更要帮助电力系统在气象数据基础上,提供新能源发电功率预测和用电负荷预测。为此,八观进行了多个方面的技术创新。

图片

首先,它采取了「全球 - 区域」协同的预测策略,在模型层面和数据层面取长补短。

在「八观」之前,很多研究机构都基于欧洲气象局的 ERA5 再分析数据训练,推出了所谓的「全球气象大模型」。但全球气象大模型距离真正的落地还存在 gap。

ERA5 的数据质量很高,但时空分辨率只有 0.25(25 公里 X25 公里的网格 ),无法满足包括电力系统在内的很多行业用户的实际需求。

为此,达摩院训练了两个气象大模型 —— 一个全球大模型和一个区域大模型。全球大模型作为底座模型,学习大气运动在时空上的宏观规律,区域大模型则纳入了包括场站数据、气象实况、开源卫星图像、开源地形在内的多源多模态数据。这些数据与描述天气特征的物理模型约束相互融合,共同对次网格尺度的局部微气象过程进行精细化建模。

具体来说,达摩院研发人员通过对不同空间分辨率但对应相同实际地域的各种数据嵌入表征的对齐,让全球模型表征和区域模型表征在各层中相互交互,将其预测精度最高提升至 1 公里 * 1 公里 * 1 小时。

图片

另一个创新点体现在架构的选择上。

在气象大模型架构方面,不同于 Swin Transformer、GNN 等架构,达摩院率先采用孪生掩码自编码器(MAE)。此类架构的原理是随机掩盖输入数据,然后训练 AI 去重建这些被掩盖的部分。比如,可在时间上取 2 个点(6 小时前和 6 小时后),在空间上将地球划分为多个小区域,掩盖(mask)一些区域。模型通过学习 6 小时前的气象数据和 6 个小时后没有被掩盖的区域来重建 6 小时后的掩盖区域,从而学习隐藏在高波动的天气数据下的鲁棒特征表示,实现对天气的精准把握。

这种架构不仅能为天气预报提供可靠的基础模型,还能支持更长时段的次季节(42 天)预测,而且能够充分考虑更多的数据(如海洋数据)。

图片

最后,「八观」还对风速、辐照度等新能源重点指标进行了优化。

在这些技术创新的加持下,「八观」气象大模型在山东经受住了考验,在前面提到的 8 月 25 日至 8 月 28 日的剧烈变化中,将下游新能源发电功率、电力负荷预测准确率分别提升至 96.5% 和 98.1%,有效帮助电力系统作出及时、准确的调度决策。

相比起传统的数值天气预报计算量庞大,需要配置机房,AI 气象大模型部署便捷,可快速推广。

据介绍,在地处大江畔的另一光伏和风电重点发展地区,八观也交出了一份优秀的答卷,将分布式光伏功率预测月平均准确率提升了 1.4%,风电功率预测月平均准确率提升了 5.5% 。

图片

达摩院决策智能实验室:不止研究 AI

自古以来,预测天气一直是一项充满挑战的任务。我们的祖先细致地观察自然界的种种迹象,例如云彩的形态与色泽、风的来向与力度、动物的行为习性、植物的生长态势等,试图破译天气变化。

进入现代,人们开始进行气象学与物理学、数学、计算机科学等学科的交叉研究,任何一个单独的学科都无法担此重任。

「八观」气象大模型背后的达摩院决策智能实验室就是这样一支具有很强学科交叉背景的团队,更结合了对产业的深刻理解。

在过去的几年里,他们在时序预测等方面积累了丰富的经验,构建了包括时序预测、时序异常检测以及对应原子算法的完整时序数据分析框架,近 3 年来,在 AI 顶级会议和期刊上发表 30 多篇论文。他们用 AI 预测新能源发电功率的成果,也在今年入选了联合国 AI for Good(人工智能向善)案例集。

未来,八观将持续向着「更懂产业的气象预报」这一目标发力。团队还计划将模型的应用范围扩展到民航、体育赛事、农业等多个领域,与这些领域共同迎战风云变幻。

参考链接:

https://www.chinawater.com.cn/df/sd/202410/t20241010_1057216.html