我国人口众多,水资源分布不均、供需矛盾突出。强烈的人类活动对水文过程影响巨大,水库蓄水、引洪灌溉、河流改道、跨流域调水等对水循环过程造成了不同程度的干扰。因此,水文站观测得到的径流数据往往无法反映自然状态下的水文过程,难以客观揭示大尺度河川径流变化的自然规律。排除观测水文数据中人类活动影响,将径流资料恢复到流域大规模治理以前的“天然”情况,对于认识水文自然规律、国家水资源可持续利用以及应对气候变化政策制定具有重要意义。然而,我国现有的天然河川径流资料存在时间缺失率高、水文站点密度不足等问题,在年际和年内尺度上均存在较大的偏差。
北京师范大学地理科学学部缪驰远课题组利用VIC(Variable Infiltration Capacity)分布式水文模型,结合流向校正、参数不确定分析和统计后处理等数据质量控制方法,重建了一套长时序、高质量的中国天然河川径流数据集,数据涵盖全国330个水文站1961~2018年的天然月值径流量(图1,数据将持续更新)。该研究相关论文以“High-quality reconstruction of China's natural streamflow”为题,即将发表于Science Bulletin2022年第5期。
图1 中国地表水资源与 330个水文站点空间分布。地表水资源量来自《2019年中国水资源公报》。中国十大流域包括:I, 松花江; II, 辽河; III, 海河; IV, 黄河; V, 淮河; VI, 长江; VII, 东南诸河; VIII, 珠江; IX, 西南诸河; X, 西北诸河。
在刻画狭窄峡谷、平坦地区及曲率较大地区的流域水量时,常规的DEM自动流向提取存在较大的误差。研究者通过流向校正,使流域出口上游汇水格点数量与流域汇水面积的线性关系得到大幅增强(图2a~b),径流量模拟精度显著提高(图2c~e)。流向校正较好地降低了径流模拟过程中由上游来水不足或过高导致的误差,提高了水文模型的模拟精度。在模型参数方面,研究者提出了一种结合敏感性分析、参数自动优化和参数区域化的不确定性分析框架。通过基于替代模型的参数自动优化ASMO算法(Adaptive Surrogate Modeling based Optimization algorithm)与多尺度参数区域化MPR技术(Multi-scale Parameter Regionalization technique)的耦合,不仅能够解决水文模型默认敏感参数可能存在的误判与遗漏问题,还能实现有资料流域及无资料地区的模型最优参数快速传递,从而提高模型参数率定过程的客观性、准确性和有效性。在统计后处理方面,研究者通过累积密度函数映射的概率分布来校正整个模拟期(1961~2018年)的径流量,从而降低源自水文模型径流量模拟的系统误差(例如气象驱动、校准数据及模型结构偏差),进一步提高数据集的可信度。
图2 流向校正前后的模型性能评估。(a)经流向校正后的天然河川径流量空间分布。(b) 流向校正前后330个水文站的控制流域面积与汇水格点数量之间的关系。(c~e) 分别为3个试点区域水文站点流向校正前(红线)后(蓝线)径流模拟时间序列对比,其中橙色点表示用于验证的天然径流量。
经对比,全国330个水文站模拟径流的相关系数CC(Correlation Coefficient)、百分比偏差Pbias(Percent bias)、纳什效率系数NSE(Nash-Sutcliffe Efficiency)和Kling-Gupta效率系数KGE(Kling-Gupta Efficiency)平均值分别为0.92、17.13%、0.77和0.70;其中,NSE和KGE大于0.70的水文站分别占83%和56%(图3)。在此基础上应用统计后处理的偏差校正,全国330个站点模拟径流的平均百分偏差(Pbias)锐减至2.27%,其他三个评价指标进一步增大。整体上看,该研究重建得到的天然河川径流数据集精度较高,覆盖时间长,可为明晰水文过程自然规律,厘清陆地水循环系统各组分互馈机制,以及制定气候变化环境下中国水资源综合管理政策提供重要基础数据与科学支撑。
图3 模型性能指标评估结果。左侧图为 230个训练站点在率定期(196~1969年,红色点)和验证期(1970~1979年,蓝色点)的模型优化结果,右侧图为100个训练站点1961~1979年的模型验证结果