Page 212 - 《高原气象》2022年第6期
P. 212

6 期                      贾何佳等:基于机器学习的西南地区遥感干旱监测与评估                                         1575
               如对农业生产有重要影响的土壤水分的动态变化,                                    表1   SPEI和MCI指数干旱等级划分
               也可以反映长期水资源的演变情况,还能计算多尺                             Table 1  Drought grade division of SPEI and MCI indices
               度时间的变化,对干旱情况能够有效反映。利用                                 干旱等级            类型           SPEI/MCI值
               TRMM3B43 数据计算 1 月尺度的 SPI 指数,得到                           1            无旱             -0. 5<
               TRMM3B43-SPI数据,具体计算过程可参阅陈少丹                              2            轻旱          (-1. 0,-0. 5]
               等(2018)的文献。                                              3            中旱          (-1. 5,-1. 0]
               2. 4. 4  标准化降水蒸散指数(SPEI)                                 4            重旱          (-2. 0,-1. 5]
                   SPEI 指数在计算潜在蒸散量时推荐了 Penman                           5            特旱             ≤-2. 0
               Monteith 与 FAO Thornthwaite 两种方法,Thornth‐
                                                                 引入树组合使随机森林可以处理非线性数据,同时
               waite 方法由于获取数据容易,计算方法相对简单,
               被广泛运用于干旱监测。本文主要利用 Thornth‐                        能有效处理缺省值和数据异常。且在处理时,即使
               waite方法计算 1980-2019 年西南地区 1 月、3 月、6               有很大一部分的特征遗失,仍可以维持监测准确
               月尺度的 SPEI 指数,分别用 SPEI1、SPEI3、SPEI6                度,在缺测数据的重建补充上随机森林更优于支持
               指代,可表示不同时间尺度的干旱类型,具体计算                            向量机和人工神经网络(王少影等,2020),因此首
               过程可参阅蔡思扬等(2017)的文献。                               先采用随机森林算法对地表温度进行重建。
               2. 4. 5  气象干旱综合指数(MCI)                            3. 1. 1  随机森林模型构建
                   MCI 指数不仅考虑了不同时期降水对干旱的                             研究表明,LST 与 NDVI 存在密切联系(Price,
               影响,还增加了不同地区不同农业生态区的月份调                            1990)。本文以 2010-2019 年西南地区遥感地表温
               节参数,能够适用于不同作物生长季气象干旱的监                            度产品 MOD11A2、MYD11A2 的 LST_Day 和 LST_
               测。MCI指数的计算公式如下:                                   Night 波段与植被指数产品 MOD13A3、MYD13A3
                          (                                      的 NDVI、EVI、Red reflectance、NIR_reflectance 波
               MCI = Ka × a × SPIW 60 + b × MI 30 + c × SPI 90
                     +d × SPI 150)                       (3)     段,以及 DEM 高程数据为输入参数,以地面气象
                                                                 站点实测地表温度为学习对象,在 Python环境下构
               式中:MCI为气象干旱综合指数;Ka为季节调节系
                                                                 建随机森林模型,其中通过站点经纬度与时间可以
               数,主要根据不同季节各地主要农作物对土壤水分
                                                                 完成遥感与地面数据的统一。研究以 2010-2019
               的敏感程度进行。SPIW60为近 60天标准化权重降
                                                                 年数据集中随机抽取 70% 样本作为训练集,30% 样
               水指数,MI30 为近 30 天相对湿润指数,SPI90 为近
                                                                 本作为测试集进行。
               90 天标准化降水指数,SPI150 为近 150 天标准化降
                                                                 3. 1. 2  精度评估与验证
               水指数,a、b、c、d分别为该指数的权重系数。具体
                                                                     经过模型调优后,最终确定重建地表温度的随
               各指数计算方法及权重系数取值于气象干旱等级
                                                                 机森林模型,最优参数如表 2 所示。为了验证模型
              (GB/T 20481-2017)(张存杰,2017),这里不再赘述。                的精确度,主要选取均方根误差 RMSE(Root Mean
                   文中对季节的划分为春季(3-5 月)、夏季(6-
                                                                 Squared Error)、平均绝对偏差 MAE(Mean Absolute
               8 月)、秋季(9-11 月)和冬季(12 月至次年 2 月)。
                                                                 Error)、可 释 方 差 得 分 EVS(Explained Variance
               SPEI 和 MCI 指数干旱等级划分一致,具体见表 1
               所示。                                                     表2   重建地表温度随机森林模型最优参数
                                                                 Table 2  Reconstruction of optimal parameters of random
               3   研究结果                                                 forest model for land surface temperature

               3. 1  随机森林重建地表温度                                      参数名                参数意义            最优参数
                   由于不同地区的气候和地形等条件差异巨大,                            max_features  单个决策树使用特征的最大数量         ‘auto’
               MODIS 地表温度在不同地区的精度相差较大,同                             max_depth       指定树的最大深度              15
               时在云层较厚情况下,观测的为云顶温度而并非地                             min_samples_split  分裂一个节点需要的最小样本数        2
               表温度(程渊,2020),在使用地表温度 LST 进行研                       min_samples_leaf  每个叶子节点包含的最少样本数         1
               究时发现,MOD11A2、MYD11A2 的 LST_ Day 和                    n_estimators    建立决策树的数量              537
               LST_ Night均有大量缺失值和错误值。随机森林是                           bootstrap       是否有放回抽样              True
               以决策树为基学习器的集成学习算法,准确度高,                                criterion    指定切分质量的评价准则             mse
   207   208   209   210   211   212   213   214   215   216   217