Page 155 - 《武汉大学学报(信息科学版)》2025年第6期
P. 155
第 50 卷第 6 期 徐胜华等:多尺度特征学习的轻量化滑坡易发性评价方法 1177
度滑坡特征,提高了模型对重要特征的感知和利 1.2 数据源
用能力,减少了网络的参数数量和计算量,并在 本研究所需的数据包括滑坡点分布数据和
保持模型性能的同时提高了计算效率,使得滑坡 评价因子数据。滑坡点分布数据来源于中国科
易发性预测模型更高效和实用。 学院资源环境科学数据中心的地质灾害点空间
分布数据,评价因子数据来源于中国科学院资源
1 研究区概况及数据来源 环境科学数据中心的地质灾害点空间分布数据
集、中国自 1980 年以来年降水的空间插值数据集
1.1 研究区概况 及第一次全国地理国情普查成果数据、开放街道
本文研究区安康市位于陕西省东南部,地处 地图数据和国家地震科学数据中心全国活动断
108°00′E~110°12′E,31°42′N~33°50′N。 总 面 层矢量数据,主要数据来源和类型见表 1。构建
评价因子数据集时,以数字高程模型为基准,按
2
积约 23 500 km ,其中山地约占 92.5%,丘陵约占
照 30 m×30 m 的格网栅格单元对研究区进行划
5.7%,川道平坝占 1.8%。研究区最低海拔 170 m,
分,共计 4 279 个滑坡灾害单元。顾及滑坡点与
最高海拔 2 964.6 m。安康市地质构造十分复杂,
非滑坡点之间的距离不小于 500 m、非滑坡点与
属秦岭和巴山两大地质构造单元,主体为秦岭地
非滑坡点之间的距离不小于 500 m 距离约束条
槽褶皱带,部分为四川台面斜边圆弧形褶皱带,地
件,在研究区内随机选择与滑坡灾害单元数目一
层以古生代海相建造为主。属亚热带大陆性季风
致的非滑坡灾害单元。从由滑坡灾害单元和非
气候,平均气温介于 15~17 ℃,水量丰沛,多年平 滑坡灾害单元共同组成的样本数据集中随机选
均降水量为 926.2 mm。水系主要属于长江流域 择 70% 作为训练集,剩下 30% 作为测试集,每个
2
和汉江水系,河网密度为 1.43 km/km ,呈叶脉状 数据集包含滑坡决策属性(即是否滑坡)和特征
排列的独特格局。 属性(即各项评价因子值)。
表 1 数据来源和类型
Table 1 Data Sources and Data Types
数据 来源 类型
地质灾害点 中国科学院资源环境科学数据中心资源环境科学数据平台地质灾害点空间分布数据集 矢量
植被指数 中国科学院资源环境科学数据中心资源环境科学数据平台中国植被指数遥感反演数据集 栅格
降雨量 中国科学院资源环境科学数据中心资源环境科学数据平台中国自 1980 年以来年降水的空间插值数据集 栅格
高程 第一次全国地理国情普查成果数据 栅格
距居民点距离 第一次全国地理国情普查成果数据 矢量
距道路距离 开放街道地图数据 矢量
距河流距离 开放街道地图数据 矢量
距断裂带距离 国家地震科学数据中心全国活动断层矢量数据 矢量
1.3 评价因子处理 距离为评价因子,如图 1 所示。
滑坡的影响因素较多,评价因子选取对易发 由于评价因子的量纲不同,需将数据归一化
性评价结果至关重要,本文结合研究区的地理环 到[0,1]。滑坡灾害的发生受多种评价因子的综
境背景分析,从地形地貌、植被、水文、人类活动 合影响,而这些因子之间可能存在共线性问题。
因素 4 个方面选取 13 个评价因子。考虑安康市 如果利用共线性强的因子构建滑坡易发性评价
三山夹两川的特殊地形及其多样地貌特点,选取 模型,会导致模型数据冗余,不仅增加了计算量,
高程、坡度、坡向、地貌、平面曲率、坡度变率、剖 还会影响模型预测精度。斯皮尔曼(Spearman)
面曲率、坡向变率为评价因子;考虑植被能提高 等级相关系数是衡量两个变量的相关性的非参
土体的渗透性、根系对土体的加固效应,选取植 数指标,被定义为等级变量之间的皮尔逊相关系
被指数为评价因子;考虑水文条件对滑坡体滑动 数,利用单调函数评价两个统计变量的相关性。
起到润滑剂的作用,选取年降雨量、距河流距离 将每个评价因子按升序排序并为每个对应值分
为评价因子;考虑频繁的人类活动易破坏斜坡稳 配秩次,计算两个评价因子的每个观测值的秩次
定条件而诱发滑坡,选取距道路距离、距居民点 差的平方和,从而计算相关系数,计算式为: