Page 210 - 《高原气象》2022年第6期
P. 210
6 期 贾何佳等:基于机器学习的西南地区遥感干旱监测与评估 1573
相对覆盖范围更广、空间分辨率更高,以及时效性 机器学习方法在干旱监测中的性能,发现随机森林
更强,目前主要应用于大面积区域干旱监测(刘闯 的效果相对更好。机器学习方法构建多致灾因素
和葛成辉,2000)。由于传统的遥感干旱监测大多 综合监测模型目前已成为遥感监测干旱的重要思
针对降水、植被状态等单一因素进行,而区域干旱 路,然而以往研究中采用的机器学习算法大多是随
往往是多种因素共同影响的结果,因此将多种致灾 机森林、支持向量机等,而由 Chen and Guestrin
因素综合考虑,从而建立干旱监测模型将更加合 (2016)完 善 的 XGBoost(eXtreme Gradient Boost‐
理。目前,构建综合干旱指数的方法主要分为三 ing)模型,具有精度高、正则化项防止过拟合、使
类:权重组合、联合分布和机器学习(吴志勇等, 用二阶导数损失更精确,能大大提升算法的效率,
2021)。针对这三种方法,学者们也进行了大量的 减少计算时间等优点,目前在工业、医学方面得到
研究,如 Lu et al(2019)利用多种遥感数据,基于 15 了较多的应用,但在干旱监测方面应用较少。因
种权重方案,通过构建具有最佳权重组合的综合干 此,本文尝试使用 XGBoost 算法进行干旱研究,判
旱指数 ISDI(Integrated Scaled Drought Index),并应 断其在干旱研究中的适用性,可为干旱监测提供新
用于监测美国农业干旱,发现其具有较好的稳健性 的思路。同时,以往研究中对于站点较少的西藏地
和实用性。Hao(2013)基于 Copula 联合分布法,结 区研究较少,本文引入机器学习方法,分析其在站
合标准化降水指数和土壤湿度指数,建立 MSDI 点较少地区干旱监测的适用性,能为站点较少地区
(Multiple Standardized Drought Index)指数监测了 的干旱监测提供一种新方法。
加利福尼亚和北卡罗莱纳州的干旱情况,并成功应 2 资料选取与方法介绍
用于全球干旱监测系统。Liu et al(2020)利用机器
学习中的反向传播神经网络,结合降雨量、陆地表 2. 1 研究区概况
面温度 LST(Land Surface Temperature)、归一化差 西南地区包括四川、重庆、西藏、云南和贵州
异 植 被 指 数 NDVI(Normalized Difference Vegeta‐ 五个省区市,位于78°42′E-110°11′E 和21°13′N-
tion Index)、土壤水容量和海拔数据构建了 IDI(In‐ 36°53′N,属于亚热带季风气候和高原山地气候。
tegrated agricultural Drought Index)综合干旱指数, 年降水量在 600~2300 mm 之间,降水分布不均,整
发现 IDI 能够很好地监测农业干旱事件的发生与强 体呈“东多西少”的分布格局,少雨和多雨地区雨量
度。沈润平等(2017)利用随机森林机器学习方法 相差可达 5 倍(张琪等,2014;李强等,2020)。区
构建了遥感干旱监测模型,并对河南干旱事件进行 内地势起伏大,地形地貌复杂多变,包含有青藏高
了评价与分析,发现模型监测结果与旱情较为一 原、云贵高原、四川盆地及周边山地。独特的气候
致。Han et al(2019)利用随机森林学习 SPI 指数, 与地形地貌形成了西南地区种类多样的植被分布,
基于特征相对重要性构建因子系数,计算得到 CD‐ 其植被类型主要有 9 类,其中,草原、草甸和高山
MI(Combined Drought Monitoring Index)指数,发 植被主要分布在高海拔地区,中海拔地区主要为灌
现 CDMI 与 SPI(Standardized Precipitation Index)、 丛、针叶林、阔叶林和沼泽,低海拔地区主要分布
RSM(Relative Soil Moisture)都有较好的相关性。 有草丛和栽培植被(张远东等,2011;赵倩倩等,
机器学习算法可适用于大量样本,对缺失值不 2021)。
敏感,能够从大量的数据中提取关键信息,并同时 2. 2 数据来源
考虑多个特征,能够在不考虑干旱形成机制的前提 主要使用了来自 NASA(National Aeronautics
下,结合多种关键致灾因子进行综合考虑,得到较 and Space Administration) (https://ladsweb.
为优秀的预测结果与不同致灾因子的重要性,已成 modaps. eosdis. nasa. gov/search/)的 2010-2019 年
为干旱监测的重要方法。相关研究也表明相对于 Terra 星和 Aqua 星的植被指数产品(MOD13A3 和
权重组合与联合分布,机器学习方法在干旱监测应 MYD13A3)、 地 表 温 度 产 品(MOD11A2 和
用中往往能取得更优异的效果。如 Hartigan et al MYD11A2)、植被覆盖类型产品(MCD12Q1)和降
(2020)利用线性回归和支持向量机对年降水量和 水产品(TRMM3B43);土壤水分数据 ESASMCCI
最高温度进行研究,发现支持向量机比线性回归具 (European Space Agency Soil Moisture Climate
有更好的效果。Omid et al(2020)基于水文环境数 Change Initiative)来 自 欧 空 局(https://www. esa-
据集,分析了回归树、增强回归树、随机森林、多 soilmoisture-cci. org/),以下简称 SM 数据;数字地
元自适应回归、柔性判别分析和支持向量机等多种 形高程数据 DEM(Digital Elevation Model)来自地