Page 191 - 《高原气象》2026年第2期
P. 191

2 期                       殷齐娥等:基于机器学习的机场低能见度短临预报研究                                         491
                             表5  特征筛选前后LightGBM算法和XGBoost算法预测未来1 h低能见度的分类报告
                      Table 5  Classification reports of LightGBM and XGBoost of low visibility in an hour by feature screening
                                              精确率               召回率              F1_score          最佳参数
                   模型名称          准确率
                                            0        1        0       1        0        1        ln       n
                 LightGBM_32_1h  0. 93    0. 93    0. 92    0. 96    0. 87    0. 94    0. 89    0. 03    1250
                 LightGBM_24_1h  0. 93    0. 94    0. 92    0. 96    0. 88    0. 95    0. 90    0. 2     1250
                 XGBoost_32_1h   0. 92    0. 94    0. 89    0. 94    0. 89    0. 94    0. 89    0. 2      20
                 XGBoost_24_1h   0. 94    0. 95    0. 92    0. 96    0. 91    0. 96    0. 92    0. 3      75

              (2024)利用机器学习方法开展长江流域夏季降水                           成密切相关(赵翠光等, 2022)。由此可见, 基于
               延伸期预报试验, 并对三个最优机器学习模型的集                           LightGBM 算法和 XGBoost 算法建立景德镇机场当

               合计算不同预报因子的贡献大小, 探讨了长江流域                           前低能见度的四个预测模型是具有物理意义的。
               表层土壤湿度对长江流域延伸期降水的影响机理。                                从图3可以看到, rh_ob的重要性在预报未来1 h
               对于树类模型(XGBoost、 LightGBM 等), 可以通过                 低能见度的模型中排名第一或第二, 且在重要性排名
               模型的特征重要性(feature_importances)方法来获                 前十的特征中, 相对湿度特征有2~3个, rh_ob和rh_
               取特征重要性, 进而对比分析哪些预报因子比较重                           1000均在其中, 说明地面及近地层大气的相对湿度
               要。LightGBM 的 feature_importances 可以通过特            特征仍然是预报未来 1 h 低能见度的重要因子。同
               征的分裂次数或使用该特征分裂后的增益来衡量,                            时 ,  windspeed_ob、  wind_ob、  tmp_ob、  div_850、
               XGBoost 的 feature_importances 可以通过特征在所            prmsl_ob这六个特征均在4个模型特征重要性排名前
               有树中作为划分属性的次数、 利用该特征作为划分                           十位之列。对比图2和图3, 无论预报当前低能见度
               属性带来的平均增益或使用该特作为分割影响的                             还是预报未来1 h低能见度现象, 重要性排名前十特
               平均样本数来衡量。一般情况下, 不同的衡量准则                           征中均有 rh_ob、 tmp_ob、 windspeed_ob, 其中 rh_ob
               得到的特征重要性顺序会有差异, 本文使用分裂次                           基本排名第1位; tmp_ob、 windspeed_ob两个特征在
               数作为衡量特征重要性的准则。也就是说, 一个特                           预测未来1 h低能见度的模型中重要性排名比预测当
               征在模型中用来构建决策树的次数越多, 它的重要                           前低能见度时排名靠前; vvel_925、 vvel_950、 div_
               性就相对越高; 若一个特征在不同的模型中都是比                           1000 三个特征对预测当前低能见度的模型更重要,
               较重要的, 那么该特征对标签有较好的预测能力。                           但div_850、 rh_1000、 prmsl_ob、 wind_ob四个特征对
                   由图 2 可知, 预报当前低能见度现象的四个模                       预测未来1 h低能见度的模型更重要。由此可知, 无
               型排名第一重要的特征都是 rh_ob, 且 EC 预报 925                   论预报当前低能见度还是未来1 h低能见度, 地面相
               hPa 相对湿度的重要性排名在四个模型位于前十,                          对湿度都是最重要的因子, 在预报当前低能见时,
               表明地面实际相对湿度和近地层的相对湿度对当                             1000 hPa散度、 925 hPa和950 hPa垂直速度的重要性
               前低能见有较好的预测能力, 且模型尤其依赖于地                           更大, 但预报未来 1 h 低能见度时, 850 hPa 散度、
               面实际相对湿度 rh_ob。刘季秋等(2023)根据浦东                      1000 hPa相对湿度、 机场海平面气压和风向的重要性
               机场 2000 -2019 年逐时观测资料, 统计低于 2 km                  更大。这一区别对于机场预测未来1 h低能见度是否
               的能见度与其他地面气象要素的关系, 发现低于                            持续具有重要指导意义。
               2 km 的能见度与相对湿度呈指数关系, 回归系数 R                           张庆等(2024)基于 LightGBM 算法, 通过对比
               为 0. 39, 通过了 α=0. 05 的显著性检验。这与本文                  试验分批引入地面观测特征、 ERA5 再分析资料、
               机器学习模型中最重要的特征是地面相对湿度相                             经验因子、 经纬度因子建模, 结果表明增加 ERA5
               符。同时, vvel_925 和 vvel_950、 tmp_ob 三个特征            等压面层物理量后 LightGBM 模型的性能显著提
               的重要性均位于前五, windspeed_ob、 div_1000 两               升, 0~36 h内大雾预报的 TS达 0. 3以上。而本文同
               个特征重要性位于前八, 说明近地层大气的垂直速                           样基于 LIghtGBM 算法使用地面观测特征和 EC‐
               度、 机场实际气温和风速、 1000 hPa 散度是预报低                     MWF 预报特征建立的低能见度预报模型, TS 评分
               能见度的重要因子(吴彬贵等, 2017), 而这些因子                       为 0. 84 和 0. 81。除去多站样本和预报时效两者的
               反映的是近地面气层的层结条件, 与低能见度的形                           不同, 本文在模型输入因子中增加了 1000 hPa、
   186   187   188   189   190   191   192   193   194   195   196