Page 212 - 《高原气象》2022年第6期
P. 212
6 期 贾何佳等:基于机器学习的西南地区遥感干旱监测与评估 1575
如对农业生产有重要影响的土壤水分的动态变化, 表1 SPEI和MCI指数干旱等级划分
也可以反映长期水资源的演变情况,还能计算多尺 Table 1 Drought grade division of SPEI and MCI indices
度时间的变化,对干旱情况能够有效反映。利用 干旱等级 类型 SPEI/MCI值
TRMM3B43 数据计算 1 月尺度的 SPI 指数,得到 1 无旱 -0. 5<
TRMM3B43-SPI数据,具体计算过程可参阅陈少丹 2 轻旱 (-1. 0,-0. 5]
等(2018)的文献。 3 中旱 (-1. 5,-1. 0]
2. 4. 4 标准化降水蒸散指数(SPEI) 4 重旱 (-2. 0,-1. 5]
SPEI 指数在计算潜在蒸散量时推荐了 Penman 5 特旱 ≤-2. 0
Monteith 与 FAO Thornthwaite 两种方法,Thornth‐
引入树组合使随机森林可以处理非线性数据,同时
waite 方法由于获取数据容易,计算方法相对简单,
被广泛运用于干旱监测。本文主要利用 Thornth‐ 能有效处理缺省值和数据异常。且在处理时,即使
waite方法计算 1980-2019 年西南地区 1 月、3 月、6 有很大一部分的特征遗失,仍可以维持监测准确
月尺度的 SPEI 指数,分别用 SPEI1、SPEI3、SPEI6 度,在缺测数据的重建补充上随机森林更优于支持
指代,可表示不同时间尺度的干旱类型,具体计算 向量机和人工神经网络(王少影等,2020),因此首
过程可参阅蔡思扬等(2017)的文献。 先采用随机森林算法对地表温度进行重建。
2. 4. 5 气象干旱综合指数(MCI) 3. 1. 1 随机森林模型构建
MCI 指数不仅考虑了不同时期降水对干旱的 研究表明,LST 与 NDVI 存在密切联系(Price,
影响,还增加了不同地区不同农业生态区的月份调 1990)。本文以 2010-2019 年西南地区遥感地表温
节参数,能够适用于不同作物生长季气象干旱的监 度产品 MOD11A2、MYD11A2 的 LST_Day 和 LST_
测。MCI指数的计算公式如下: Night 波段与植被指数产品 MOD13A3、MYD13A3
( 的 NDVI、EVI、Red reflectance、NIR_reflectance 波
MCI = Ka × a × SPIW 60 + b × MI 30 + c × SPI 90
+d × SPI 150) (3) 段,以及 DEM 高程数据为输入参数,以地面气象
站点实测地表温度为学习对象,在 Python环境下构
式中:MCI为气象干旱综合指数;Ka为季节调节系
建随机森林模型,其中通过站点经纬度与时间可以
数,主要根据不同季节各地主要农作物对土壤水分
完成遥感与地面数据的统一。研究以 2010-2019
的敏感程度进行。SPIW60为近 60天标准化权重降
年数据集中随机抽取 70% 样本作为训练集,30% 样
水指数,MI30 为近 30 天相对湿润指数,SPI90 为近
本作为测试集进行。
90 天标准化降水指数,SPI150 为近 150 天标准化降
3. 1. 2 精度评估与验证
水指数,a、b、c、d分别为该指数的权重系数。具体
经过模型调优后,最终确定重建地表温度的随
各指数计算方法及权重系数取值于气象干旱等级
机森林模型,最优参数如表 2 所示。为了验证模型
(GB/T 20481-2017)(张存杰,2017),这里不再赘述。 的精确度,主要选取均方根误差 RMSE(Root Mean
文中对季节的划分为春季(3-5 月)、夏季(6-
Squared Error)、平均绝对偏差 MAE(Mean Absolute
8 月)、秋季(9-11 月)和冬季(12 月至次年 2 月)。
Error)、可 释 方 差 得 分 EVS(Explained Variance
SPEI 和 MCI 指数干旱等级划分一致,具体见表 1
所示。 表2 重建地表温度随机森林模型最优参数
Table 2 Reconstruction of optimal parameters of random
3 研究结果 forest model for land surface temperature
3. 1 随机森林重建地表温度 参数名 参数意义 最优参数
由于不同地区的气候和地形等条件差异巨大, max_features 单个决策树使用特征的最大数量 ‘auto’
MODIS 地表温度在不同地区的精度相差较大,同 max_depth 指定树的最大深度 15
时在云层较厚情况下,观测的为云顶温度而并非地 min_samples_split 分裂一个节点需要的最小样本数 2
表温度(程渊,2020),在使用地表温度 LST 进行研 min_samples_leaf 每个叶子节点包含的最少样本数 1
究时发现,MOD11A2、MYD11A2 的 LST_ Day 和 n_estimators 建立决策树的数量 537
LST_ Night均有大量缺失值和错误值。随机森林是 bootstrap 是否有放回抽样 True
以决策树为基学习器的集成学习算法,准确度高, criterion 指定切分质量的评价准则 mse