论文推荐|负样本选择和评价模型对滑坡易发性预测不确定性的影响

负样本选择和评价模型对滑坡易发性预测不确定性的影响

麻晟,陈剑,李强,王小浩,水强强

DOI:10.19657/j.geoscience.1000-8527.2025.013 

摘要

滑坡易发性预测(Landslide Susceptibility Prediction,LSP)是滑坡风险评价与区域防灾减灾的重要基础,但其精度受到多种因素的制约,如滑坡负样本选择和评价模型选取。为系统评估这两个因素对LSP精度的影响,本研究以陕西省安康市瀛湖镇为例,基于10项环境因子(高程、坡度、坡向等)和222处滑坡数据,分别采用随机选取法、耦合信息量法和半监督机器学习法3种负样本选择方式,并运用信息量法(Information Value,IV)、K-means模型、随机森林(Random Forest,RF)和逻辑回归(Logistic Regression,LR)模型开展滑坡易发性预测与对比分析。结果表明:(1)耦合IV的负样本选择方法评价精度最高,优于半监督机器学习,而随机选取法性能最差。(2)监督机器学习模型(RF和LR)性能优于统计学模型(IV)和无监督机器学习模型(K-means)模型,且RF表现出更强的鲁棒性和更合理的易发性分区效果。综合表明,采用耦合IV法选择负样本并结合RF模型进行建模,可显著提升滑坡易发性预测的精度与可靠性,结果更符合实际滑坡分布规律,为瀛湖镇及其他类似地区的滑坡风险防控提供重要的科学依据。

Abstract

Landslide Susceptibility Prediction(LSP)is a crucial foundation for landslide risk assessment and regional disaster prevention and mitigation.However,its accuracy is constrained by several factors,including the selection of non-landslide samples and the selection of evaluation models.To systematically evaluate the impact of these two factors on the accuracy of LSP,this study takes Yinghu Town,Ankang City,Shaanxi Province as a case study.Based on 10 environmental factors(e. g.,elevation,slope,aspect)and 222 sets of landslide data,three non-landslide sample selection methods were adopted:namely random selection method,coupled information value(IV)method,and semi-supervised machine learning method.Meanwhile,four approaches—including the statistical Information Value(IV)method,K-means model,Random Forest(RF)model,and Logistic Regression(LR)model—were used to conduct landslide susceptibility prediction and comparative analysis.The results indicate that:(1)the coupled IV method for non-landslide sample selection achieves the high-est evaluation accuracy,outperforming the semi-supervised machine learning method,while the random selection method exhibits the worst performance.(2)supervised machine learning models(RF and LR)perform better than the statistical Information Value(IV)method and the unsupervised machine learning model(Kmeans),and the RF model exhibits stronger robustness and more reasonable landslide susceptibility zoning results.In conclusion,selecting non-landslide samples using the coupled IV method and combining it with the RF model for modeling can significantly improve the accuracy and reliability of landslide susceptibility prediction. The results are more consistent with the actual landslide distribution patterns,providing an important scientific basis for landslide risk prevention and control in Yinghu Town and other similar regions.

关键词

滑坡易发性; 负样本; 评价模型; 机器学习; 不确定性

Keywords

landslide susceptibility; non-landslide sample; evaluation model; machine learning; uncertainty

0 引言

滑坡是指斜坡岩土体在重力作用下沿某一软弱结构面发生整体滑动的现象与过程[1]。它是世界上发育最广泛的自然灾害之一,严重威胁人民生命和财产安全,因此,构建地质灾害防控体系、开展滑坡灾害预测预警研究十分必要[2,3]。滑坡易发性预测(Landslide Susceptibility Prediction,LSP)作为滑坡风险评价的基础,是区域防灾减灾的重要工具[4]。然而,LSP受到多种不确定性因素的制约,目前要获得客观、准确的滑坡易发性制图(Landslide Susceptibility Mapping,LSM)仍面临较大挑战[5]。

滑坡易发性预测建模的主要流程为:滑坡编录数据获取、环境因子选取、评价单元划分、评价模型构建与模型性能评估[6]。其中,每一个环节均存在影响最终精度的因素,例如滑坡表达方式、环境因子筛选、栅格单元分辨率确定等[7-9]。已有研究表明,评价模型对LSM结果具有重要影响。近年来,随着人工智能技术的快速发展,机器学习方法在LSP中的应用已成为研究热点[8,10]。机器学习的基本步骤指出,训练样本不仅包括由滑坡组成的正样本,还包括未发生滑坡区域的负样本,负样本的质量直接影响了机器学习模型的训练效果,给LSP带来了较大的不确定性[11]。因此,系统比较不同评价模型与负样本选择策略的优劣,对获取合理可靠的LSM具有重要指导意义。

依据建模原理可将评价模型分为启发式模型、统计学模型、机器学习模型(Machine Learning,ML)[12]。启发式模型依靠专家经验,主观性较强[13];统计学模型往往假设数据符合线性关系,此外其结果还会高估滑坡高易发区的面积[14,15];相比较而言,ML可以较好描述环境因子与滑坡数据间的非线性关系,从而获得精度更高的LSM结果。同时,依据是否需要先验知识又可将ML分为无监督机器学习(Unsupervised Machine Learning,USML)和监督机器学习(Supervised Machine Learning,SML)[4],以往研究表明SML模型通常表现出更优异的预测性能,而USML模型则因原理简单、无需标注样本,也在LSP中得到广泛应用[4]。在当前研究中,层次分析法、频率比、信息量、决策树、K-means聚类、人工神经网络等模型已被诸多学者用于LSP[16],然而不同模型建模原理不同,因此仍需探究各类评价模型预测结果的差异,以找寻适用于研究区的评价模型。本研究选取信息量(Information Value,IV)代表统计学模型,随机森林(Random Forest,RF)和逻辑回归(Logistic Regression,LR)代表监督机器学习模型,K-means聚类代表无监督机器学习,系统比较不同类型评价模型对滑坡易发性预测结果的影响。

滑坡正样本指已发生的滑坡点,通常以历史滑坡为依据,其空间位置明确、样本意义清晰;滑坡负样本指非滑坡点或至少目前处于稳定状态、还未发生明显失稳变形的样本,一般从未发生的滑坡区域选取,但负样本易混入可能发生变形的滑坡点,从而影响模型预测性能[11,17]。目前,多数研究采用随机选取策略,即在滑坡外区域随机选取负样本点[18],该方法的主要缺陷是无法保证负样本的可靠性,导致样本质量较差;为此,学者们相继提出了多种改进策略,如低坡度选取[19]、缓冲区采样[20]、目标空间向外采样[21]、耦合信息量法[22]、半监督机器学习[23]等。这些方法在一定程度上提升了负样本的可靠性,但仍各具局限性与不确定性。尽管已有研究提出了不同的负样本优化方法,但针对不同负样本选择策略如何影响滑坡易发性制图结果与预测性能的系统对比研究仍相对缺乏。

基于此,本文以陕西省安康市瀛湖镇为例,采用3种负样本选择方法(随机选取法、耦合信息量法和半监督机器学习法)和4种评价模型(信息量、逻辑回归、随机森林和K-means聚类),重点探讨负样本选择策略与评价模型对滑坡易发性预测结果不确定性的影响,以期为区域滑坡灾害精准预测提供方法参考。

目前,国内学者对矿井水生态复用的研究通常建立在对矿井水水化学特征深入认识的基础上,借助不同水化学分析方法和水质评价体系来实现。柴建禄[6]利用Piper三线图和舒卡列夫水化学分类对不同埋深煤层矿井水水质进行分析,并借助US-SL图和Wilcox图法综合评价了矿井水灌溉适宜性。Wang等[7]结合水化学图示法与聚类分析探讨了曹家滩煤矿含水层水化学特征和演化过程,采用残留碳酸钠值和可溶性钠百分比评估了矿井水质量。Mahato等[8]基于对东博卡罗煤田矿井水水化学的研究,探讨了矿井水用于家庭用水的可行性,并将镁危害纳入灌溉适宜性评估体系。李竞赢等[9]将相关性分析和主成分分析应用于矿井水水化学研究,参照现行标准实现矿井水综合水质分级,并基于钠吸附比与电导率作出矿井水盐碱害评价。于智卓等[10]利用模糊综合评价法确定了华昱矿区矿井水水质所属级别,结合各煤矿用水需求提出了矿井水生态复用新模式。

以上研究成果为矿井水水化学特征分析和生态复用提供了众多研究方法。本文以山西省西山矿区为研究区,选取西山矿区8个煤矿为研究对象,通过分析总溶解性固体(TDS)、EC、pH、K+、Na+、Ca2+、Mg2+、SO2-4、Cl-、HCO-3、CO2-3、CODCr等12项指标,系统剖析研究区矿井水水化学特征,基于模糊综合评价与灌溉水质评价方法,深入探讨西山矿区矿井水生态复用的理论可行性。目前,西山矿区尚未开展系统性矿井水生态复用相关研究,本研究结合水化学特征分析和矿井水水质生态适配研究方法,旨在科学判定西山矿区矿井水生态复用的可行性,为缺水矿区矿井水生态复用提供理论指导与技术支撑,对推动矿区可持续发展和生态建设具有重要意义。

1 研究方法

1.1 滑坡易发性建模流程

本文以陕西省瀛湖镇为例,系统探究滑坡负样本选择方法与评价模型对滑坡易发性结果的不确定性影响,具体步骤为:(1)通过资料收集、遥感解译与野外调查构建研究区滑坡编录清单,根据区域地质环境特征,综合选取高程、坡度、坡向等10个环境因子作为评价因子,并采用信息量(IV)模型计算各因子的分级信息量值;(2)基于IV和K-means聚类算法获取初始滑坡易发性制图(LSM),继而分别采用随机选取法、耦合信息量法及半监督机器学习法三种策略选择负样本,并应用随机森林(RF)与逻辑回归(LR)模型进行易发性建模,得到相应的LSM结果;(3)对比三种负样本选择方式、四种评价模型的预测结果差异,并采用易发性分区统计检验、受试者工作特征曲线(Receiver Operating Characteristic Curve,ROC曲线)和滑坡易发性指数分布规律分析滑坡易发性建模的不确定性(图1)。

图片

图1  滑坡易发性预测技术路线图

Fig.1  Flowchart of the landslide susceptibility prediction method

1.2 滑坡负样本选择方法

1.2.1 随机选取法

随机选取法是指从已发生滑坡区域以外的范围内随机选取负样本点[24],该方法首先将研究区划分为若干大小一致的网格单元,随后剔除已存在滑坡的网格,最后在剩余网格中随机选取网格点作为负样本,以此构建样本数据集(图2)。

图片

图2  随机法选择滑坡负样本示意图

Fig.2  Schematic diagram of non-landslide sample selection by random method

1.2.2 耦合信息量模型法

信息量(IV)模型仅需滑坡正样本即可实现易发性预测,基于这一特点,有学者提出了耦合统计学模型的负样本选择策略[25]。该方法首先利用统计学模型(如IV)生成初始滑坡易发性制图,然后剔除极低/低易发区中滑坡样本点,最后再在极低/低易发区内随机选择滑坡负样本点(图3)。

图片

图3  耦合统计学方法的滑坡负样本选取示意

Fig.3  Schematic diagram of non-landslide sample selection by coupled statistical methods

1.2.3 半监督机器学习法

半监督机器学习方法是近年来提出的一种滑坡负样本选择策略,该方法同时适用于负样本选择与正样本扩充,有助于增加样本数量并提升数据可靠性[23,26]。其基本思路是结合无监督和监督机器学习模型:首先利用无需数据的无监督机器学习获得初始滑坡易发性区划图;在此基础上,叠加高分辨率遥感影像和InSAR形变数据,在极高和高易发区内识别潜在滑坡样本,同时在极低和低易发区选取高置信度的滑坡负样本,共同组成新的样本数据集(图4);最终利用该数据集训练监督学习分类模型,从而获得最终滑坡易发性分区图[13,26]。在本研究中仅在其极低/低易发区选择非滑坡样本,未考虑正样本的补充。

图片

图4  半监督机器学习方法的滑坡负样本选取示意

Fig.4  Schematic diagram of non-landslide sample selection by semi-supervised machine learning method

1.3 评价模型

1.3.1 信息量模型(IV)

信息量模型(Information Value,IV)是一种基于信息论发展而来的预测评价方法,其本质属于统计分析范畴。该模型的基本原理是通过计算滑坡发生条件下熵的减少量来表征滑坡发生的可能性[27,28]。滑坡(Y)的发生受到多种因素的影响,如高程x1、坡度x2、坡向x3等因素。信息量模型认为,评价因子所提供的信息量与滑坡发生概率密切相关,总信息量越大滑坡发生概率越大,信息量计算见式(1)。

图片

式中:I(Y,x1,x2,x3,…,xn)指坡度、坡向、岩性等因子提供的总信息量;Ix1(Y,x2)为在因子x1存在的条件下,因子x2对滑坡提供的信息量。

在本研究中,将研究区划分为M个栅格单元,其中有N个栅格发生了滑坡,采用统计学方法,对I(Y,x1,x2,x3,…,xn)做出相应简化,实际信息量计算时,往往先计算单个评价因子的信息量值,再将所有因子的信息量进行叠加(式(2))。

图片

式中:I为总信息量,Ii为第i个因子的信息量,Nij为第i个因子第j个分级下滑坡发育数量,Mij为第i个因子第j个分级下的栅格数量。

1.3.2 K-means聚类

K-means聚类算法是一种典型的无监督机器学习方法,主要步骤如下[29,30]:

(1)确定K值:聚类质心数量K可根据实际需求或算法实现预先设定。本研究将滑坡易发性分为极高、高、中、低、极低五类,故设定K =5。

(2)划分样本:随机初始化聚类中心,依据欧氏距离(式(3))计算各样本与中心点的距离,并按最近邻原则将样本划分至5个簇中。

图片

(3)更新质心:重新计算每个簇中所有样本的均值,将该均值点作为新的聚类中心。

(4)迭代终止判断:重复(2)和(3),直到聚类中心不再变化或达到预设的最大迭代次数,则停止计算。

1.3.3 逻辑回归模型(LR)

逻辑回归(Logistic Regression,LR)是一种广泛应用于二分类问题的统计学模型。在滑坡易发性评价中,其目标是计算在给定环境因子组合条件下滑坡发生与否的概率,因此本质上属于二分类问题。LR采用最大似然估计进行参数拟合,并将因变量转换为二元逻辑变量(发生记为1,不发生记为0)[31-32]。

以P表示滑坡发生概率(值范围在0~1之间),为计算P,需要对P做Logit变换(式(4)),再通过Sigmoid函数将线性预测值映射到(0,1)区间内,从而得到滑坡概率P(式(5))。

图片
图片

式中:β0为常数,β1,β2,β3,…,βn为回归系数,x1,x2,x3,…,xn为自变量,本文拟采用LR-IV模型,既将IV计算结果作为LR的输入值。

1.3.4 随机森林模型(RF)

随机森林(Random Forest,RF)是一种集成学习模型,可用于分类和回归预测。近年来,RF在滑坡易发性评价中得到了广泛应用[33]。其构建过程主要包括以下步骤:首先,从原始训练集中有放回地随机选取n个样本,构成一个子数据集;然后,从所有特征中随机选取k个属性,从中选择最优特征作为分裂节点,构建一颗决策树;重复上述过程构建多棵决策树,共同组成随机森林。最终的预测结果由所有决策树投票决定[34]。

在RF中,可通过计算基尼指数(Gini index)或者袋外误差(Out-of-Bag Error)来评估特征的重要性,从而确定各环境因子对滑坡发生的相对贡献权重,进而完成易发性评价[32],基尼指数计算见式(6):

图片

式中,m为每个节点k处的滑坡数;ns为训练输入特征向量的数量;l(kui)为节点上类标签的分布,具体计算见式(7):

图片

式中:ui为类别ci的标签,为节点k中属于类别ci的样本数量,其值为ai

1.4 不确定性分析方法

1.4.1 易发性分区检验

历史滑坡是检验滑坡易发性分区合理性的最佳标准。一个合理的滑坡易发性分区通常需满足以下两个基本要求[35,36]:(1)随着分区易发性等级的提高,滑坡密度呈现增大趋势;(2)极高和高易发区应以较小的面积包含大多数的滑坡。在实际应用中,上述原则并非绝对标准,需根据具体风险管控目标与策略进行适应性调整。

1.4.2 ROC曲线

采用受试者工作曲线(Receiver Operating Characteristic Curve,ROC曲线)进行评估,可有效降低因测试集差异带来的随机干扰,使模型性能的评价更为客观[37,38]。ROC曲线纵轴为真阳性率(True Positive Rate,TPR),即敏感性(Sensitivity);横轴为假阳性率(False Positive Rate,FPR),即1-特异性(1-Specificity),Sensitivity和Specificity计算公式见式(8)和(9):

图片
图片

式中:TP、FN分别表示被分类器正确识别为滑坡的滑坡个数和被错误识别为非滑坡的滑坡个数;FP、TN分别表示被分类器错误识别为滑坡的非滑坡个数和被正确识别为非滑坡的滑坡个数。

ROC曲线下面积(Area Under Curve,AUC)是量化模型预测性能的重要指标,其取值范围为0.5~1.0。AUC值越大,表明模型的预测性能越优。通常认为:AUC值在0.5~0.7之间代表预测能力较差,0.7~0.9之间代表预测性能良好,>0.9则代表预测性能优秀[39]。

1.4.3 滑坡易发性指数分布模式

滑坡易发性指数(Landslide Susceptibility Index,LSI)是表征每个评价单元发生滑坡可能性大小的量化指标,其特征能够有效反映不同评价模型所获结果的性能与差异。即使不同模型的ROC曲线表现相近,其LSI分布也可能存在显著差异,这揭示了模型对研究区滑坡发生规律内在把握程度的不同。LSI分布分析是近年来提出的一种有效的模型性能评判补充指标,其合理性已得到诸多研究的验证[23,40-41]。

一般认为,合理的LSI分布应具备均值较小、标准差较大的特点。较小的均值表明研究区整体滑坡发生概率处于较低水平;较大的标准差则意味着模型能够更好地区分不同稳定状态的单元,从而使易发性分区结果更为分明。在本研究除计算LSI的均值和标准差外,还通过分析其频率分布直方图深入探究不同模型预测结果的内在差异。

2 背景与数据

2.1 研究区地质和地理概况

瀛湖镇位于陕西省安康市汉滨区南部,汉江穿镇而过,整体地势南北高,中间低(图5)。根据第三次全国国土调查数据,瀛湖镇总面积约199.99 km2,海拔范围195~1175 m。该地区属北亚热带湿润-半湿润季风气候,四季分明、光照适宜、降雨丰沛。区内出露地层主要包括新生界、上古生界、下古生界、上元古界,岩性以灰岩、板岩、千枚岩为主。研究区大地构造位于秦岭褶皱系南秦岭印支褶皱带与北大巴山加里东褶皱带的交接部位,区内发育两条小型断裂;区域地震活动性较弱,地震震级普遍较小,地震基本烈度为Ⅵ度[42]。

图片

图5  瀛湖镇地理位置图

Fig.5  Geographical location map of Yinghu Town

2.2 滑坡数据源

本研究采用的滑坡数据主要来自于资料收集与遥感解译。根据“汉滨区瀛湖镇地质灾害风险调查评价(1:10000)”项目成果,通过实地调查与历史记录共确认滑坡46处,该数据精度高、可靠性强;此外,基于高分辨遥感影像识别出176处滑坡,这些多为历史调查中遗漏的小型滑坡。两种滑坡数据源在空间覆盖上互为补充,共同构成了本研究的基础滑坡编录。综上,截至目前,瀛湖镇共发育滑坡222处[5,42]。滑坡空间分布见图6(a),部分典型滑坡的野外照片见图6(b—e)。滑坡总面积约1.67 km2,其中最大滑坡面积约0.12 km2,最小约140 m2,平均面积约7540 m2,规模以小型为主。

图片

图6  瀛湖镇滑坡空间分布(a)与野外照片(b)(c)(d)(e)

Fig.6  Spatial distribution of landslides in Yinghu Town(a)and field photos(b)(c)(d)(e)

2.3 环境因子

根据瀛湖镇地质环境特征以及相关文献,基于ArcGIS软件共提取10个环境因子(图7),并采用30m分辨率栅格进行制图表达,滑坡点则采用后缘中心点进行表征[5,43]。

图片

图7  瀛湖镇环境因子(平面曲率和剖面曲率未列入)

Fig.7  Environmental factors in Yinghu Town(planar curvature and profile curvature not included)

环境因子共分为以下五类:(1)地形地貌:高程、坡度、坡向、平面曲率、剖面曲率;(2)地表覆被:归一化植被系数(Normalized Difference Vegetation Index,NDVI);(3)水文气象因子:距河流距离、年均降雨量;(4)地层岩性;(5)人类工程活动:距道路距离。对于连续型因子,采用自然间断点法进行分级;离散型因子则按实际情况进行分级。

3 滑坡易发性结果

3.1 环境因子分析与相关性检验

计算各环境因子信息量值(IV),以此分析滑坡分布与各因子之间的关系,结果见表1。

表1  评价因子信息量计算表

Table 1  Calculation of information value for each evaluation factor class

图片

(1)地形地貌因子。所有地形地貌因子均基于数字高程模型(Digital Elevation Model,DEM)中提取。由表1可知,高程在230~417 m区间范围内IV>0,表明该高程区间为滑坡易发区,主要原因是该区域位于汉江两岸,人类工程活动强烈。随着坡度的增加,IV呈现增大趋势,在>36.87°的陡坡区域滑坡最为发育。坡向控制了太阳辐射强弱、局部气候和岩石风化强弱[37,44],研究区东、东南、东坡向的IV>0,为滑坡易发坡向。平面曲率反映了地形曲率对水流速度的影响[45],其值在<-2.29或>2.02范围内更易发育滑坡。剖面曲率反映了剖面基本形态(>0为凸形坡,<0为凹形坡),在<-2.11和>2.50区间内滑坡易发性较高。

(2)地表覆被因子。地表覆被通过影响降雨入渗和地表径流,进而影响滑坡的稳定性[46]。本研究采用归一化植被系数(NDVI)表征植被覆盖程度,其值越大表示植被越茂密[47]。如表1所示,随着NDVI值增大,IV呈现先增后减趋势,在0.62~0.72范围达到最大值。值得注意的是,滑坡发育数量随NDVI值增大而增加,可能与植物根劈作用促进岩土体风化破碎有关;此外,还可能与遥感影像获取时间有关,不同影像时间的NDVI值存在差异,从而导致统计误差[41]。

(3)水文气象因子。河流冲刷导致坡脚失稳,进而降低斜坡稳定性[48]。由表1可见,随着距河流距离的增大,滑坡发育数量和IV总体呈下降趋势,距河流400 m范围内滑坡最为发育。年均降雨量反映了区域降雨强弱,在850~900 mm和1000~1050 mm区间内IV>0。其中850~900 mm区间的高易发性主要与该带位于汉江河谷区,人类工程活动强烈有关,降雨起到了诱发作用。

(4)地层岩性因子。地层岩性决定了岩土体的物理力学性质,进而控制滑坡易发性[49]。由表1可知,研究区滑坡主要发育在千枚岩地层(108处)。硅质板岩的IV值最高(0.38),表明该岩性条件下边坡最易失稳。

(5)人类工程活动因子。以距道路远近代表人类工程活动强弱。道路开挖形成的切坡破坏原始地形条件,降低斜坡稳定性[42]。如表1所示,滑坡数量随距道路距离增加而减少,<200 m范围内滑坡最为密集。在800~1000 m范围内,IV突然增大,可能原因是在该范围内滑坡发育主要受其他环境因素控制,道路的影响程度降低。

使用高相关的环境因子用于滑坡易发性建模会降低评价精度,本研究将222个滑坡样本点excel信息作为输入,在python中使用皮尔逊相关性系数法对评价因子进行相关性检验,结果见表2。当相关性系数(r)满足| r | ≤0.5时,认为因子之间相关性较弱[50],表2显示,所有因子之间的| r|均小于0.5,故保留全部因子参与易发性建模。

表2  瀛湖镇评价因子相关性矩阵

Table 2  Correlation matrix of evaluation factors in Yinghu Town

图片

3.2 信息量模型与K-means的滑坡易发性

将所有环境因子带入模型进行滑坡易发性计算。基于表1各因子信息量值,按式(2)进行信息量叠加,得到全区信息量分布,其值范围为-6.257~4.998。按照自然间断点法将结果分为5类:极高易发区、高易发区、中易发区、低易发区和极低易发区(图8(a))。对于K-means算法,参数设置为:聚类数K=5,最大迭代次数200次;以10个环境因子的信息量图层为输入,得到研究区易发性划分结果(图8(b))。

图片

图8  不同模型滑坡易发性分区图

Fig.8  Landslide susceptibility zoning maps for different evaluation models

图8显示,信息量模型(IV)与K-means模型结果存在较大差异。由于K-means算法基于数据相似性进行聚类,其分区结果在空间上更为集中。总体而言,两个模型的结果均表明瀛湖镇的滑坡发育受到道路、河流的控制,极高和高易发区多分布在道路河流附近,其中K-means的结果尤为显著,极高和高易发区几乎呈现为线状分布。

3.3 随机选取法的滑坡易发性

按照1:1比例在222个滑坡点外的区域内随机选取222个点作为滑坡负样本点[51]。将滑坡点标记为1,非滑坡点标记为0,以构建样本数据集。按照7:3比例将样本数据集划分为训练集和测试集,分别用于模型训练与验证[52]。

为降低单一模型带来的偶然性,并系统比较模型性能差异[40],本研究使用随机森林(RF)和逻辑回归(LR)两种模型。通过试错法确定模型最优参数:RF的决策树数量为500;LR惩罚系数c =0.1,最大迭代次数500。后续章节中相同模型的参数设置与此一致,不再赘述。

基于LR和RF模型得到滑坡易发性指数(LSI)分布图,并按照自然间断法将易发性分为5类(图8(c)和(d))。结果显示两种模型的分区格局基本一致,极高和高易发区均集中于汉江两岸及道路附近,但LR的极高易发区面积明显高于RF。与IV模型结果相比,RF和LR的高易发区面积较小,而IV的中易发区面积偏大,这表明引入负样本能有效抑制模型对高易发性的过度预测,结果更为合理。

3.4 耦合信息量的滑坡易发性

基于信息量结果(图8(a)),剔除极低和低易发区中的滑坡点,再从该区域随机选取222个点作为负样本。数据处理方式和模型参数设置同3.2节,最终得到基于LR和RF的易发性分区结果(图8(e)和(f))。

结果显示,采用耦合信息量法选择负样本时,得到的极高易发区面积偏少,滑坡也高度集中分布在该区域,分区结果相较于随机法更为光滑,空间模型更加合理。

3.5 半监督机器学习的滑坡易发性

依据半监督机器学习框架,首先采用无监督机器学习算法(K-means)生成初始滑坡易发性分区图(图8(b)),之后在极低和低易发区选取负样本[22]。最终得到基于LR和RF的滑坡易发区分区结果(图8(g)和(h))。

4 滑坡易发性结果不确定性分析

4.1 滑坡易发性分区

表3统计了上述8种模型易发性分区面积、各分区内滑坡数量及滑坡点密度。图9展示了各评价模型不同易发性等级内的滑坡点密度,图10则对比了各模型易发性分区面积占比与滑坡发育数量占比。

表3  不同评价模型易发性分区结果统计表

Table 3  Statistical results of landslide susceptibility zoning for different evaluation models

图片
图片

图9  评价模型易发性分区滑坡点密度计算结果

Fig.9  Calculation results of landslide density in susceptibility zones for each evaluation model

图片

图10  不同评价模型易发性分区统计结果

Fig.10  Statistical results of landslide susceptibility zoning for different evaluation models

统计结果表明,随着易发性等级升高,滑坡点密度均呈现递增趋势,说明这8种模型分区结果总体合理。然而,不同模型的分区结果差异较大。其中,信息量RF的极高易发区占比最小,仅为9.93%,但却有86.49%的滑坡分布在该区域;随机RF的极高易发区面积占比最大,为44.85%,预测了78.38%的滑坡;极低易发区面积占比最大值和最小值则分别出现在随机RF、K-means模型。

4.2 ROC曲线

基于测试集样本绘制了各评价模型的ROC曲线(图11),以评估模型的预测性能。由于Kmeans为无监督模型无法输出概率值,因此未能绘制其ROC曲线[4]。计算各ROC曲线下面积值(AUC)(图11),结果表明这7种模型的AUC值均大于0.7,表明所有模型的预测结果均合理。其中,信息量模型AUC值最小(0.794),信息量RF最大(0.921)。并且RF模型的AUC值均高于相应负样本策略下的LR模型,表明RF模型的预测性能更优。

图片

图11  ROC曲线

Fig.11  ROC curves

4.3 滑坡易发性指数分布模式

尽管不同模型的ROC曲线表现相近,但其滑坡易发性指数(LSI)在分布上却存在明显差异,这反映了模型对研究区整体滑坡发生潜力把控的不同[53],RF和LR模型的LSI分布图如12所示。

计算各模型LSI的平均值和标准差(图12),结果显示:信息量LR的均值最小(0.401),半监督RF均值最大(0.488);随机RF的标准差最大(0.315),信息量LR标准差最小(0.146)。随机RF的LSI分布呈现双峰特征(低易发性和高易发性区各出现一个波峰),表明该模型区分滑坡和非滑坡的能力较强,但代价是高估了高易发区范围;同时,其低易发区面积较大,说明模型认为非滑坡区域整体稳定性较高。在信息量RF、半监督RF、随机LR、信息量LR及半监督LR中,除半监督RF和半监督LR的LSI分布曲线中部较为平缓外,其余模型的分布模式相近,均近似正态分布,表明半监督机器学习的负样本选择方法对易发性分区的识别能力不强,各个分区面积基本一致。

图片

图12  滑坡易发性指数分布图

Fig.12  Distribution of the landslide susceptibility index for different models

5 讨论

5.1 负样本选择方式对评价结果影响

本文系统比较了三种滑坡负样本选择方法:随机选取法、耦合信息量模型法及半监督机器学习法。为消除评价模型本身的不确定性,采用随机森林(RF)与逻辑回归(LR)两种模型进行预测,共得到六组结果:随机RF、随机LR、信息量RF、信息量LR、半监督RF和半监督LR。

ROC曲线检验结果(图11)表明:在RF模型中,预测精度表现为耦合信息量法(0.921)>半监督法(0.876)>随机法(0.862);在LR模型中,耦合信息量(0.800)=半监督法(0.800)>随机法(0.796)。由此可见,无论采用何种评价模型,随机选取法的预测精度均较低,而耦合信息量法则提高了预测精度,尤其在RF模型中表现卓越。

通过分析各模型的LSI分布规律(图12)发现,对于RF,随机法倾向于高估研究区间的高易发区范围,其LSI均值较高,表明该方法通过扩大高易发区面积来捕捉更多滑坡。结合图8发现,随机法的滑坡易发性分区结果相较于耦合信息量法的分区,其空间变异性差,分区结果并不理想。相反,耦合信息量法表现更为优异的结果,图12结果显示,在RF中,耦合信息量法的LSI近似正态分布且右偏,其高易发区面积占比较小,低易发区面积较大,更加符合研究区滑坡发育的实际情况。对于LR,半监督法的LSI分布与随机法相似,尽管其AUC值略高。

综上所述,耦合信息量法能同时实现更高的预测精度与更合理的空间分区效果,显著优于随机法。其根本原因在于:随机法无法保证负样本点的可靠性,易混入潜在滑坡点,导致训练过程出现误判。而耦合信息量法,其负样本来自极低和低易发区,负样本真实度高,模型训练效果好;半监督法虽原理与耦合信息量法类似,但其性能受限于K-means初始分区的准确性。对比图8(a)和8(b)可发现,IV与K-means的分区结果差异显著,K-means空间变异性差,其低易发区分布合理性不如IV,导致半监督法的性能提升有限。

5.2 评价模型对评价结果影响

本研究共使用了四种评价模型:信息量模型(IV)、K-means、随机森林(RF)、逻辑回归(LR)。其中IV属于统计学模型,K-means属于无监督机器学习,RF和LR属于监督机器学习。不同类型的模型在性能上表现出显著差异。

图8、图9及图10结果表明,8种易发性分区结果均较合理:极高易发区以较小面积预测了大多数的滑坡,且滑坡点密度随着易发性等级升高而增加。通过计算各模型低与极低易发区的面积占比(表3),发现IV模型的面积占比最低(35.33%),无监督模型(K-means)低于监督机器学习(RF和LR),而在监督模型中,RF占比普遍高于LR。这表明机器学习模型(RF和LR)的分区结果优于统计学模型(IV),且RF的性能优于LR。这是因为监督学习模型引入了负样本,抑制了模型对高易发区的高估,从而使低易发区范围更加合理。

仅通过分区面积统计无法直观判断模型优劣,因此本研究进一步比较了各模型分区结果的空间分布模式。以K-means的分区结果为例(图13(a)),其分区结果差异性小,易发区呈明显的线状分布,与道路、河流走向一致,实用性较低。例如图13(b)和13(c)两个区域,极低易发区的空间变异性小,其分布明显受岩层控制,边界与岩层界线基本吻合。这是由于该岩层单元内仅发育1处滑坡,其信息量值远低于其他岩性类别,在聚类分析中被视为“异常值”,导致分区结果失真。

图片

图13  基于K-means的滑坡易发性结果(a)与局部异常(b)(c)

Fig.13  Landslide susceptibility results based on K-means(a)and localized anomalies(b)(c)

为深入比较,截取各模型在图13(b)的分区结果(图14)进行详细分析。

图片

图14  对应于图13(b)的滑坡易发性分区图

Fig.14  Landslide susceptibility zoning map for the area in Figure 13(b)

(1)RF模型的分区结果空间分异性高,鲁棒性强。无论采用何种负样本选择策略,在板岩、千枚岩地层出露区,RF的分区结果均呈现较高的离散性,包含有极低、低、中和高多种易发等级,表明其对异常值不敏感,稳定性好。

(2)LR模型的分区结果空间分异低,鲁棒性较差。相较于RF和IV,无论采用何种负样本选择策略,LR在该岩性区的分区结果较为集中,主要为极低和低易发区。此外,LR的结果对负样本选择策略敏感。例如,采用随机法的分区效果较好(图14(f)),而采用信息量(图14(g))和半监督法(图14(h))时效果较差。这是因为后两种方法从极低易发区选取负样本,若该区域与板岩千枚岩分布区重叠,会导致模型过度学习岩性特征,从而使极低易发区异常偏向于该岩性区。

ROC曲线定量评价结果(图11)进一步表明:无论采用何种负样本选择策略,RF的AUC值均高于LR;IV的AUC值最低(0.794),仅略低于随机LR(0.796)。以上分析结果表明:机器学习模型(RF和LR)性能优于统计学模型(IV);在机器学习模型中,监督机器学习模型效果优于无监督模型;且RF模型因其更强的鲁棒性和更高的预测精度,成为本研究的最优模型。

5.3 研究的优势和局限性

5.3.1 研究优势

本研究的滑坡数据具有多元化和高可靠性的特点。数据主要源自两个方面:一是基于“汉滨区瀛湖镇地质灾害风险评价调查(1:10000)”项目的调查成果,通过实地核查与历史记录确认了46处滑坡,该数据精度高、可靠性强;二是通过高分辨率遥感解译,额外识别了176处历史调查中遗漏的小型滑坡,并进行了野外验证,确保了数据的真实性。两种数据源在空间覆盖上形成有效补充,构成了更为完整的滑坡编录清单,使本研究的数据库相较于以往研究更为全面,从而提升了易发性评价结果的客观性与可靠性[5,42,54]。

在研究方法上,本研究以陕西省瀛湖镇为典型案例,系统设计了对比试验框架:采用3种负样本选择策略(随机选取法、耦合信息量法、半监督机器学法)与4种评价模型(信息量模型、Kmeans、随机森林、逻辑回归),综合运用易发性分区统计、ROC曲线及LSI分布模式评价指标,从多维度交叉验证并比较不同方法的预测结果。这种从多方法、多角度的系统对比分析,有效降低了单一方法或偶然因素带来的不确定性。

5.3.2 普适性讨论

本研究结论虽源于瀛湖镇个例,但其揭示的规律是否具有普适性?对此本文以文献综述的方式开展进一步的研究,将本文研究结果与其他文献的结果进行对比分析。例如,周晓亭[22]、刘福臻[55]等学者分别在江西省瑞金市、四川省南江县采用耦合信息量、半监督机器学习负样本选择方法开展滑坡易发性建模,结果表明这些方法均优于随机选取法;此外黄发明[40]在江西省石城县、常志璐[4]在江西省宁都县、邱维蓉[56]在甘肃省灵台县的对比研究也一致发现,机器学习模型(尤其是随机森林)的预测性能优于启发式与统计学模型,且监督学习模型优于无监督模型。本研究得出的“耦合信息量+随机森林”模型的最优结论,与上述不同地区、不同环境下的研究结果基本吻合,表明其具有较强的普适性。

相较于以往多聚焦于单一影响因子或单一模型对比的研究,本研究系统性地将多种负样本选择策略与多种评价模型相结合进行综合对比,不仅弥补了单一方法研究的不足,降低了偶然误差,而且为其他地区开展滑坡易发性建模时选择负样本策略与评价模型选择提供了重要理论支持和实践指导,降低了滑坡易发性建模的不确定性。

5.3.3 局限性和未来展望

本研究的局限性主要体现在对滑坡类型和时态信息的考虑不足。不同成因机制(如堆积层滑坡、岩崩)的滑坡,其发育主控环境因子和空间分布规律存在较大差异[57,58]。本研究采用的滑坡编录在类型上属于地貌清单[6],仅记录滑坡的位置信息,而未区分其具体类型和发生时间。例如,实地调查的46个滑坡多为浅层的堆积层滑坡(Colluvial landslides),而遥感解译新增的176处则包含大量岩崩(Rock fall)和岩块滑落(Block slide)。未考虑类型差异可能在一定程度上影响模型的精度

未来的研究可在以下方面深入:一是构建区分滑坡类型的精细编录,并提出一种考虑滑坡类型的易发性预测模型,以提高预测精度。二是引入时间维度,融合时序InSAR监测、降水事件等动态因子,提出一种时变易发性评价模型,从而提高评价结果的实用价值[6,59]。

6 结论

(1)研究区共识别滑坡222处,以小型滑坡为主。环境因子分析表明,瀛湖镇滑坡最易发生的地质环境条件为:高程230~417 m,坡度>36.87°、东坡向、NDVI值范围0.62~0.72、距河流距离<400 m、年均降雨量850~900 mm、地层岩性为硅质板岩、距道路距离<200 m。

(2)在基于随机森林模型(RF)和逻辑回归模型(LR)的易发性建模中,对比三种负样本选择方法(随机选取法、耦合信息量法、半监督机器学习法),耦合信息量法在RF和LR模型中均表现出最优性能,其预测精度高于半监督机器学习方法,优于随机选取法。其中,耦合信息量RF模型的AUC值最高(0.921),较随机RF模型(AUC = 0.862)提升约6.8%。

(3)机器学习模型(RF、LR)的预测性能优于统计学模型(IV),不确定性低,极低/低易发性分区合理,预测精度更高。在机器学习模型中,监督机器学习模型(RF和LR)整体优于无监督机器学习模型(K-means)。随机森林(RF)模型鲁棒性更强,抗干扰能力优于逻辑回归(LR),其易发性分区结果空间格局合理,实用价值更高。

参考文献

[1]许强.对滑坡监测预警相关问题的认识与思考[J].工程地质学报,2020,28(2):360-374.[百度学术] 

[2]李刚,王宁,张凯逊,等.西巴伦支海盆地含油气系统分析与资源评价[J].地质力学学报,2023,29(2):174-187.[百度学术] 

[3]许强,陆会燕,李为乐,等.滑坡隐患类型与对应识别方法[J].武汉大学学报(信息科学版),2022,47(3):377-387.[百度学术] 

[4]CHANG Z L,DU Z,ZHANG F,et al.Landslide susceptibility prediction based on remote sensing images and GIS:Comparisons of supervised and unsupervised machine learning models[J]. Remote Sensing,2020,12(3):502.[百度学术] 

[5]MA S,CHEN J,WU S E,et al.Landslide susceptibility prediction using machine learning methods:A case study of landslides in the Yinghu Lake Basin in Shaanxi[J].Sustainability,2023, 15(22):15836.[百度学术] 

[6]REICHENBACH P,ROSSI M,MALAMUD B D,et al.A review of statistically-based landslide susceptibility models[J].Earth-Science Reviews,2018,180:60-91.[百度学术] 

[7]HUANG F M,YAN J,FAN X M,et al.Uncertainty pattern in landslide susceptibility prediction modelling:Effects of different landslide boundaries and spatial shape expressions[J].Geoscience Frontiers,2022,13(2):101317.[百度学术] 

[8]HUANG F M,LIU K J,JIANG S H,et al.Optimization method of conditioning factors selection and combination for landslide susceptibility prediction[J]. Journal of Rock Mechanics and Geotechnical Engineering,2025,17(2):722-746.[百度学术] 

[9]HUANG F M,TENG Z K,GUO Z Z,et al.Uncertainties of landslide susceptibility prediction:Influences of different spatial resolutions,machine learning models and proportions of training and testing dataset[J].Rock Mechanics Bulletin,2023,2(1):100028.[百度学术] 

[10]窦杰,向子林,许强,等.机器学习在滑坡智能防灾减灾中的应用与发展趋势[J].地球科学,2023,48(5):1657-1674.[百度学术] 

[11]黄发明,曾诗怡,姚池,等.滑坡易发性预测建模的不确定性:不同“非滑坡样本”选择方式的影响[J].工程科学与技术,2024,56(1):169-182.[百度学术] 

[12]MARJANOVIC' M,KOVACˇEVIC' M,BAJAT B,et al.Landslide susceptibility assessment using SVM machine learning algorithm[J].Engineering Geology,2011 ,123(3):225-234.[百度学术] 

[13]HUANG F M,YIN K L,HUANG J S,et al.Landslide susceptibility mapping based on self-organizing-map network and extreme learning machine[J].Engineering Geology,2017,223:11-22.[百度学术] 

[14]MARTINOVIC' K,GAVIN K,REALE C.Development of a landslide susceptibility assessment for a rail network[J].Engineering Geology,2016,215:1-9.[百度学术] 

[15]NOURANI V,PRADHAN B,GHAFFARI H,et al.Landslide susceptibility mapping at Zonouz Plain,Iran using genetic programming and comparison with frequency ratio,logistic regression,and artificial neural network models[J].Natural Hazards, 2014,71(1):523-547.[百度学术] 

[16]于海坤,欧阳九发,王丙千,等.不同采样策略下的区域滑坡易发性评价[J].安全与环境工程,2024,31(5):122-134,162.[百度学术] 

[17]缪亚敏.滑坡危险度评价中的负样本采样方法研究[D].南京:南京师范大学,2016.[百度学术] 

[18]戴福初,姚鑫,谭国焕.滑坡灾害空间预测支持向量机模型及其应用[J].地学前缘,2007,14(6):153-159.[百度学术] 

[19]KAVZOGLU T,SAHIN E K,COLKESEN I.Landslide susceptibility mapping using GIS-based multi-criteria decision analysis, support vector machines,and logistic regression[J].Landslides,2014,11(3):425-439.[百度学术] 

[20]TIAN Y,XIAO C C,LIU Y,et al.Effects of raster resolution on landslide susceptibility mapping:A case study of Shenzhen[J].Science in China Series E:Technological Sciences,2008,51(2):188-198.[百度学术] 

[21]HONG H Y,MIAO Y M,LIU J Z,et al.Exploring the effects of the design and quantity of absence data on the performance of random forest-based landslide susceptibility mapping[J].Catena, 2019,176:45-64.[百度学术] 

[22]周晓亭,黄发明,吴伟成,等.基于耦合信息量法选择负样本的区域滑坡易发性预测[J].工程科学与技术,2022,54(3):25-35.[百度学术] 

[23]HUANG F M,CAO Z S,JIANG S H,et al.Landslide susceptibility prediction based on a semi-supervised multiple-layer perceptron model[J].Landslides,2020,17(12):2919-2930.[百度学术] 

[24]PHAM B T,PRADHAN B,TIEN BUI D,et al.A comparative study of different machine learning methods for landslide susceptibility assessment:A case study of Uttarakhand area (India)[J].Environmental Modelling &Software,2016,84:240-250.[百度学术] 

[25]郭衍昊,窦杰,向子林,等.基于优化负样本采样策略的梯度提升决策树与随机森林的汶川同震滑坡易发性评价[J].地质科技通报,2024,43(3):251-265.[百度学术] 

[26]HUANG F M,XIONG H W,JIANG S H,et al.Modelling landslide susceptibility prediction:A review and construction of semisupervised imbalanced theory[J]. Earth-Science Reviews, 2024,250:104700.[百度学术] 

[27]张晓东,刘湘南,赵志鹏,等.信息量模型、确定性系数模型与逻辑回归模型组合评价地质灾害敏感性的对比研究[J].现代地质,2018,32(3):602-610.[百度学术] 

[28]王佳佳,殷坤龙,肖莉丽.基于GIS 和信息量的滑坡灾害易发性评价:以三峡库区万州区为例[J].岩石力学与工程学报,2014,33(4):797-808.[百度学术] 

[29]WANG Q,WANG Y,NIU R Q,et al.Integration of information theory,K-means cluster analysis and the logistic regression model for landslide susceptibility mapping in the Three Gorges area, China[J].Remote Sensing,2017,9(9):938.[百度学术] 

[30]MWAKAPESA D S,MAO Y M,LAN X J,et al.Landslide susceptibility mapping using DIvisive ANAlysis (DIANA)and RObust clustering using linKs (ROCK)algorithms,and comparison of their performance[J].Sustainability,2023,15(5):4218.[百度学术] 

[31]DAI F C,LEE C F.Landslide characteristics and slope instability modeling using GIS,Lantau Island,Hong Kong[J].Geomorphology,2002,42(3/4):213-228.[百度学术] 

[32]吴赛儿,陈剑,ZHOU Wendy,等.基于逻辑回归模型的泥石流易发性评价与检验:以金沙江上游奔子栏—昌波河段为例[J].现代地质,2018,32(3):611-622.[百度学术] 

[33]CHEN W,PENG J B,HONG H Y,et al.Landslide susceptibility modelling using GIS-based machine learning techniques for Chongren County,Jiangxi Province,China[J].Science of the Total Environment,2018,626:1121-1135.[百度学术] 

[34]BRAVO-LÓPEZ E,FERNÁNDEZ DEL CASTILLO T,SELLERS C,et al.Analysis of conditioning factors in cuenca,Ecuador,for landslide susceptibility maps generation employing machine learning methods[J].Land,2023,12(6):1135.[百度学术] 

[35]许冲.实际滑坡是滑坡危险性评价结果合理性检验最好的标准[J].工程地质学报,2013,21(6):908-911.[百度学术] 

[36]张晓敏.基于GIS的陕西省滑坡灾害危险性评价及分区研究[D].西安:长安大学,2019 .[百度学术] 

[37]CANTARINO I,CARRION M A,GOERLICH F,et al.A ROC analysis-based classification method for landslide susceptibility maps[J].Landslides,2019,16(2):265-282.[百度学术] 

[38]HUANG F M,TAO S Y,LI D Y,et al.Landslide susceptibility prediction considering neighborhood characteristics of landslide spatial datasets and hydrological slope units using remote sensing and GIS technologies[J]. Remote Sensing, 2022, 14(18):4436.[百度学术] 

[39]安雪莲,密长林,孙德亮,等.基于不同评价单元的三峡库区滑坡易发性对比:以重庆市云阳县为例[J].吉林大学学报(地球科学版),2024,54(5):1629-1644.[百度学术] 

[40]HUANG F M,CAO Z S,GUO J E,et al.Comparisons of heuristic,general statistical and machine learning models for landslide susceptibility prediction and mapping[J].Catena,2020, 191 :104580.[百度学术] 

[41]KE C Y,HE S,QIN Y G.Comparison of natural breaks method and frequency ratio dividing attribute intervals for landslide susceptibility mapping[J].Bulletin of Engineering Geology and the Environment,2023,82(10):384.[百度学术] 

[42]麻晟,陈剑,吴赛儿.陕西省安康市瀛湖镇滑坡灾害分布特征与易发性分析[J].现代地质,2024,38(2):437-450.[百度学术] 

[43]DOU J,YUNUS A P,MERGHADI A,et al.Different sampling strategies for predicting landslide susceptibilities are deemed less consequential with deep learning[J].Science of the Total Environment,2020,720:137320.[百度学术] 

[44]陈晓利,冉洪流,祁生文.1976 年龙陵地震诱发滑坡的影响因子敏感性分析[J].北京大学学报(自然科学版),2009 , 45(1):104-110.[百度学术] 

[45]CHEN W,XIE X S,WANG J L,et al.A comparative study of logistic model tree,random forest,and classification and regression tree models for spatial prediction of landslide susceptibility[J].Catena,2017,151 :147-160.[百度学术] 

[46]陈绪钰,李明辉,王德伟,等.基于GIS 和信息量法的四川峨眉山市地质灾害易发性定量评价[J].沉积与特提斯地质,2019,39(4):100-112.[百度学术] 

[47]HUANG F M,ZHANG J,ZHOU C B,et al.A deep learning algorithm using a fully connected sparse autoencoder neural network for landslide susceptibility prediction[J].Landslides,2020,17(1):217-229.[百度学术] 

[48]邱海军.区域滑坡崩塌地质灾害特征分析及其易发性和危险性评价研究:以宁强县为例[D].西安:西北大学,2012.[百度学术] 

[49]GUO Z,HUANG Y,AYDIN A.Double-frequency microseisms on the thick unconsolidated sediments in eastern and southeastern coasts of United States:Sources and applications on seismic site effect evaluation[J].Journal of Earth Science,2021 ,32(5):1190-1201.[百度学术] 

[50]高华喜,殷坤龙.降雨与滑坡灾害相关性分析及预警预报阀值之探讨[J].岩土力学,2007,28(5):1055-1060.[百度学术] 

[51]LIU Q,TANG A P,HUANG D L.Exploring the uncertainty of landslide susceptibility assessment caused by the number of nonlandslides[J].Catena,2023,227:107109.[百度学术] 

[52]SHIRZADI A,SOLAIMANI K,ROSHAN M H,et al.Uncertainties of prediction accuracy in shallow landslide modeling:Sample size and raster resolution[J].Catena,2019,178:172-188.[百度学术] 

[53]黄发明,胡松雁,闫学涯,等.基于机器学习的滑坡易发性预测建模及其主控因子识别[J].地质科技通报,2022,41(2):79-90.[百度学术] 

[54]DU J,GLADE T,WOLDAI T,et al.Landslide susceptibility assessment based on an incomplete landslide inventory in the Jilong Valley,Tibet,Chinese Himalayas[J].Engineering Geology, 2020,270:105572.[百度学术] 

[55]刘福臻,王灵,肖东升.机器学习模型在滑坡易发性评价中的应用[J].中国地质灾害与防治学报,2021 ,32(6):98-106.[百度学术] 

[56]邱维蓉,吴帮玉,潘学树,等.几种聚类优化的机器学习方法在灵台县滑坡易发性评价中的应用[J].西北地质, 2020,53(1):222-233.[百度学术] 

[57]HUANG F M,XIONG H W,YAO C,et al.Uncertainties of landslide susceptibility prediction considering different landslide types[J].Journal of Rock Mechanics and Geotechnical Engineering,2023,15(11):2954-2972.[百度学术] 

[58]郭子正,殷坤龙,黄发明,等.基于滑坡分类和加权频率比模型的滑坡易发性评价[J].岩石力学与工程学报,2019, 38(2):287-300.[百度学术] 

[59]刘星洪,姚鑫,杨波,等.川西高原活动性滑坡识别与空间分布特征研究[J].地质力学学报,2023,29(1):111-126.[百度学术] 


期刊介绍

图片

《现代地质》

《现代地质》创刊于1987年,双月刊,是由教育部主管、中国地质大学(北京)主办的地球科学领域的综合性学术期刊。荣誉主编为邓军院士,主编为刘大锰教授。期刊秉承“百花开放,百家争鸣”的方针,以地球系统科学为核心框架,聚焦多圈层相互作用与跨学科交叉研究。目前被中国科学引文数据库(CSCD)、北大中文核心、中国科技核心以及SCOPUS数据库等收录。

主编介绍

图片

刘大锰教授

刘大锰,教授,博士生导师,国务院政府特贴获得者,中国地质学会会士,长期从事煤层气地质勘探与开发。主持国家重点研发计划项目、国家自然科学重点基金等20余项。获国家科技进步二等奖1项、省部级科技成果一等奖4项和二等奖3项,北京市教育教学成果一等奖2项和二等奖1项;发表学术论文400余篇,SCI收录190余篇(第一作者/通讯作者94篇),SCI他引9400余次,入选Elsevier中国高被引学者,斯坦福全球2%顶尖科学家;授权发明专利17件。据“科睿唯安”统计,有10篇ESI 1% 高被引论文。目前兼任《Unconventional Resources》共同主编,《Energy Reports》和《Energy Exploration and Exploitation》副主编。

现代地质GEOSCIENCE

排版 | 孟源

责任编辑 | 袁茂文

审核 | 董立