Page 214 - 《高原气象》2022年第6期
P. 214
6 期 贾何佳等:基于机器学习的西南地区遥感干旱监测与评估 1577
节带来的噪音影响;TCI 指数基于 LST 计算得到,
反映了地表感热通量,即当植被干旱期水分减少
时,气孔关闭,感热通量增加;TRMM-SPI 指数能
反映研究区降水分布状态及异常情况;而土壤含水
量的减少也是造成干旱的直接原因之一(郭焘等,
2019)。因此,在研究西南地区干旱情况时,综合
考虑了植被、温度、降水、植被覆盖类型、土壤含
水量和 DEM 等多种因素。同时,由于部分输入参
数可以反映干旱对农业和植被等的影响效果,相对
可能比 SPEI 所选时间尺度的响应要慢,会存在时
图3 西南地区2010-2019年遥感监测、气象站点实测和随 间不同步的现象,而不同时间尺度的 SPEI 也可以
机森林监测重建的地表温度月变化 在一定程度上代表不同时间尺度的干旱类型,因此
Fig. 3 Monthly change of land surface temperature on remote 研究将所有输入参数与反映不同时间尺度的 SPEI
sensing monitoring,meteorological station measurement and
值进行相关分析,结果见表 4 所示。从表 4 中可以
random forest(RF)monitoring reconstruction in
发现,由于输入参数所反映的旱情都相对更加接近
Southwestern China from 2010 to 2019
于 1个月尺度的 SPEI值,因此后续的研究中主要选
响;VCI 指数基于 NDVI 计算得到,能有效降低季 取SPEI1作为期望输出参数构建监测模型。
表4 输入参数与不同时间尺度SPEI值的相关系数
Table 4 Correlation coefficients between input parameters and SPEI values at different time scales
尺度 NDVI RED NIR EVI LST TCI VCI TRMM CCI
SPEI1 0. 080 0. 055 0. 106 0. 071 -0. 154 0. 528 ** 0. 141 0. 834 ** 0. 481 **
SPEI3 0. 099 0. 012 0. 085 0. 072 -0. 123 0. 422 ** 0. 316 ** 0. 566 ** 0. 475 **
SPEI6 0. 114 -0. 083 0. 049 0. 077 -0. 045 0. 223 * 0. 470 ** 0. 413 ** 0. 453 **
**和*分别表示通过了0. 01和0. 05的显著性水平检验
3. 2. 1 XGBoost模型构建 表5 XGBoost回归监测模型最优参数
随机森林算法对缺失值、异常数据能有很好的 Table 5 Optimal parameters of the XGBoost
regression monitoring model
处理,但却会忽略掉属性之间的相关性,降低回归
的效果。而 XGBoost通过引入二阶泰勒展开,精度 参数名 参数意义 最优
参数
更高,同时 XGBoost 的基学习器可以是决策树(gb‐
n_estimators 子模型的数量 203
tree),也可以是线性分类器(gblinear),灵活性更
max_depth 指定树的最大深度 2
高,且支持列抽样,不仅能降低过拟合,还能减少
learning_rate 每个迭代产生模型的学习率 0. 06
计算。因此以 2010-2019 年西南地区 TCI 指数、
min_child_weight 每个叶子节点包含的最少样本数 2
VCI 指数、TRMM-SPI 指数、MCD12Q1、上下午星
Subsample 随机采样的比例 0. 8
补全的 NDVI、EVI、Red_ reflectance、NIR_ reflec‐
Gamma 控制是否后剪枝 0
tance 以及随机森林重建的 LST、SM、DEM 数据作
colsample_bytree 控制每棵随机采样列数的占比 1
为输入参数,西南地区气象站点计算的 SPEI1 值作
colsample_bylevel 每棵树每次节点分裂时候列采样的比例 0. 5
为期望输出参数,利用 python语言构建 XGBoost监
reg_alpha L1正则项的权重 0. 01
测模型。其中将土地覆盖类型数据主要合并为农
eval_metric 衡量验证数据的参数 ‘mse’
田、林地、草地、水体、城镇建设用地和未利用地 6
大类(夏文韬等,2010)。2010-2019 年数据集中随 3. 2. 2 模型精度评估
机抽取 70% 样本作为训练集,30% 样本作为测试 同样选取RMSE、MAE、EVS和R作为模型监测
集,经过 XGBoost 参数调优得到的最优参数见表 5 精度评价指标,具体见表 6 所示。结果表明,训练
所示。 集的监测值与 SPEI 值 R 达到 0. 982,测试集达到