收稿日期:2024-03-18
资助项目:国家重点研发计划项目(2023YFC3205600);国家自然科学基金项目 (41807500)
第一作者:关效羽(1999—),男,硕士研究生,主要从事自然灾害危险性研究。E-mail:1339640300@qq.com
通信作者:杨文涛(1987—),男,博士,教授,主要从事遥感与自然灾害研究。E-mail:yang_wentao@bjfu.edu.cn
[目的]通过构建随机森林模型,全面评估和预测全国范围内的滑坡危险性,为防灾减灾提供科学依据和决策支持。[方法]基于9个典型地震区域(如汶川、芦山、鲁甸等)的滑坡样本数据,综合提取滑坡正负样本点,并结合地形、降雨、土地利用、NDVI等多因子数据,利用栅格标准化处理和波段合成技术,构建随机森林模型进行训练与验证。在此基础上,应用模型对全国范围的滑坡危险性进行预测,并通过AUC值等指标评估模型性能,分析关键影响因子及其作用机制。[结果]1)随机森林模型在多个地震区域均表现出较高的预测性能,AUC值最高接近1,表明模型具有较强的适用性与稳定性;2)影响地震滑坡危险性的关键因子为坡度(slope)和坡面曲率(slope curvature),以上因子在地震滑坡危险性识别中起主导作用;3)全国范围的滑坡危险性预测结果显示,模型能够有效识别高危险性区域,且这些区域与实际滑坡分布高度一致,空间分布呈现出明显的区域性特征。[结论]随机森林模型在滑坡危险性评估中具有较高的准确性和稳定性。通过识别关键影响因子并揭示其空间分布特征,为未来滑坡灾害的预测、区域可持续发展规划及防灾减灾措施的制定提供科学支撑和参考依据。
本研究的研究区为中国大陆范围及其邻近地震滑坡易发区(图1),该区域地形复杂,地貌类型多样,地质环境具有显著的多样性和区域性。全国范围内的滑坡灾害多集中在青藏高原东缘、南北地震带和川滇地区,该类区域的地形起伏剧烈,坡度陡峭,岩性复杂,受多条大型断裂带(如龙门山断裂带和红河断裂带)的影响,地震活动频繁,易触发大规模的滑坡灾害。此外,该区域的气候条件复杂多变,西南和中部山区的降雨强度较大,滑坡的发生也受到降雨和人类活动的共同驱动。
为提高模型的代表性和预测的普适性,选取全国范围及其邻近区域内的9个典型地震样本区域,分别为2013年芦山、2005年克什米尔、2014年鲁甸、2017年九寨沟、2017年米林、2013年岷县、2015年尼泊尔、2008年汶川及2010年玉树地震滑坡数据(图2),该类数据主要由应急管理部国家自然灾害防治研究院许冲团队通过目视解译高精度遥感影像制作,覆盖多种地形地貌和地质背景。该地震事件均由高质量的、利用空间要素标识的地震滑坡数据,共有228 112处真实的地震滑坡记录。
在这些区域中,结合200 m高分辨率的DEM高程、相对高差、土地利用、降雨、地形因子(包括坡度、坡向及坡面曲率)等评价因子数据和滑坡分布数据,通过ArcMap 10.8软件平台获取正负样本点,建立基于多因子栅格标准化与随机森林模型的全国滑坡危险性预测框架。通过选取典型区域作为样本区,模型能够充分学习到全国范围内多样化的滑坡触发条件与环境特征,为全国范围内的滑坡危险性预测提供关键的样本支撑和技术保障。
影响因子的选取是地震滑坡危险性评价的关键步骤,其选取主要与地震滑坡的产生机制、区域特征及学者们的经验有关。地震滑坡影响因子总体可分为地震因子、地形因子、地质因子、环境因子及历史因子5个类别。本研究选取地形因子(包括高程、相对高差、坡度、坡向和坡面曲率)、地形湿度指数、土地利用、植被覆盖指数、年降水量共9个影响因子(表1)。所有影响因子数据均在ArcGIS软件中进行集成并与研究区的地震滑坡数据一起构成地震滑坡数据库,将数据格式统一为200 m×200 m的栅格数据(图3)。
在地震滑坡危险性分析中,由于全国范围内不同因子的数值范围可能与局部研究区域的数值范围差异较大,例如,坡度、坡向、曲率等因子,可能导致模型对局部研究区域的预测效果不理想。因此,为了让全国范围内的数据适配于模型的预测,需要对全国的因子栅格进行标准化处理,将其调整到与局部研究区一致的范围。计算公式为:
通过各图层的相关性分析,去除共线性高的因子。滑坡易发性评价模型中,需要保证各因子之间的相关性较小,因此需要进行相关性分析。计算相关性系数能反映各评价指标之间的相关性,本研究使用斯皮尔曼法计算各因子之间的相关性系数(R)。根据系数大小,将相关性分为线性相关(|R|= 1)、高度相关(0.8≤|R|< 0.8)、低度相关(0.3≤ |R|<0.5)、微弱相关(|R|< 0.3)。计算公式为:
在前期研究中,利用ArcGIS软件对滑坡分布图进行空间分析,从已知发生滑坡的区域提取滑坡正样本点;对于负样本点的提取,选择在未发生滑坡的区域随机选取等量的点来作为负样本点。为了更全面地代表复杂地形和环境差异,本研究优化了负样本提取策略:首先,在研究区域内的非滑坡区域提取等量负样本,确保样本空间分布的可对比性;其次,在全国范围内的非滑坡区域再次随机选取等量负样本点,以增强模型对更广泛地形和环境条件的适应性,避免模型因局部样本分布的局限性而导致泛化能力不足。此方法能够有效减少模型在不同区域滑坡预测中的偏差,提高模型在复杂地形和多样环境下的鲁棒性,从而更准确地反映全国范围内滑坡发生的潜在风险。同时提取这些样本点对应的环境因子数据,如高程、坡度、降雨量、地形湿度指数等,生成用于建模的样本数据集。
随机森林(randomforest,RF)模型是一种基于集成学习的决策树方法,由BREIMAN提出,是Bagging方法中最具代表性的算法之一。随机森林模型中的每棵决策树均基于独立生成的随机向量进行训练,这些决策树在整个森林中具有相同的分布特征。分类预测时,随机森林模型会构建n棵决策树,每棵树对分类结果具有一票投票权,最终通过概率加权或多数表决机制确定目标类别。(1)在模型训练过程中,随机森林采用自助采样法(bootstrapsampling),从原始样本中随机有放回地抽取m个样本,构成一个初始训练集。由于抽样方式的统计学特性,每次抽样中大约1/3的样本未被选中,这部分未被采样的观测值被称为袋外数据(outof-bag,OOB),为模型提供无需交叉验证的性能评估途径。(2)通过迭代执行上采样过程,模型总共生成k个初始训练集,并在每个训练集上构建1棵不剪枝、自由生长的决策树。这些决策树的预测结果共同组成随机森林的分类输出。(3)最后,随机森林模型的输出结果基于k棵决策树的概率平均值,并将概率值最大的类别作为最终的分类结果。此方法确保随机森林模型在分类问题中具备较强的鲁棒性和泛化能力,在处理高维数据和特征重要性评估方面具有优势。概率值计算公式为:由图4可知,各因子间相关性均未超过80%,可见所有因子之间的独立性较高,且避免多重共线性问题,同时还表明每个因子均在模型中具有独立且有效的预测贡献,没有高度重叠。因此,可以使用这些因子来构建较为精确的预测模型。
由表2可知,滑坡的发生是多种自然和人为因素共同作用的结果,不同因素对滑坡危险性的影响程度各不相同。由图5可知,坡度、高程、坡向等地形因子在控制地表物质稳定性方面起关键作用。具体来说,中高坡度(30°~50°)和中等海拔高度(1 500~2 500 m)、中高相对高差(2 000~3 000 m)对于滑坡危险性影响较高,而坡向影响相对较小;地形曲率与滑坡频率比之间呈现一定正相关,曲率较大的区域滑坡风险较高,可能与地表水流汇集和侵蚀作用有关。
由图6a、图6h可知,九寨沟和芦山地震模型在四川盆地边缘、龙门山断裂带及横断山区等区域表现出高滑坡危险性。此类地区以高山峡谷地貌为主,地形起伏剧烈,断裂活动强烈,地层破碎,再加上该区域年平均降雨量较大,地震触发滑坡的潜在性极高。由图6d、图6e可知,汶川和岷县地震模型的预测范围更广,高危险性区域不仅集中在四川西部,还延伸至青藏高原东南缘、川藏交界一带及秦岭大巴山地区。这些地方普遍地形复杂、地质条件差,加上人类活动和降雨的影响,导致滑坡风险更加突出。
由图6b、图6f、图6i可知,克什米尔、玉树和鲁甸地震的模型也在川滇交界和云贵高原等地区预测出较高的滑坡危险性。其中,鲁甸地震模型在云贵高原东北部的表现较为明显,可能与该地区地貌、软弱岩层和集中降雨等因素有关。玉树模型则在青藏高原内部显示出较高的危险性区域,提示高海拔地区在冻融作用和地震影响下也存在较大的滑坡潜在风险。总体来看,不同地震模型在全国范围内的滑坡危险性预测结果存在一定差异,既反映各地震区受自身地质和地貌特征的影响,也说明滑坡的发生具有一定的区域性和复杂性。结合各区域的地形条件、岩性分布和气候因素分析,有助于更准确地识别全国范围内的滑坡高风险区。由图8可知,我国滑坡危险性具有明显的区域差异性。整体来看,滑坡高危区主要集中在西南部及中部山地丘陵地带,如四川、云南、贵州、西藏等地。该类区域因地形起伏大、断层密集且地震活动频繁,滑坡发生的概率显著高于东部和西北部平原地区。由图9可知,根据建模结果发现,9个评价因子在全国滑坡危险性预测中的特征重要性占比分别为相对高差占27%,年平均降雨量占26%,高程占15%,坡度占11%,植被覆盖因子占7%,坡面曲率占4%,地形湿度指数占4%,坡向占3%,土地利用占3%。本研究基于9个典型地震区滑坡样本,构建了具有区域适应性的多因子随机森林模型,实现全国尺度下滑坡危险性高精度预测(AUC最高接近1)。相对高差、年平均降雨量、高程和坡度是主控因子,揭示地形与气候耦合驱动的滑坡发生机制。该模型突破传统单因子(如PGA)预测的局限,理论上深化滑坡致灾机制的理解,实践上为地震区自然灾害防治与国土空间规划提供可推广的科学方法。
关效羽,杨文涛.基于2005—2017年中国及周边地区9场地震滑坡制作的全国滑坡危险性[J].水土保持学报,2025,39(06):168-180+193.
DOI:10.13870/j.cnki.stbcxb.2025.06.005.