Page 191 - 《高原气象》2026年第2期
P. 191
2 期 殷齐娥等:基于机器学习的机场低能见度短临预报研究 491
表5 特征筛选前后LightGBM算法和XGBoost算法预测未来1 h低能见度的分类报告
Table 5 Classification reports of LightGBM and XGBoost of low visibility in an hour by feature screening
精确率 召回率 F1_score 最佳参数
模型名称 准确率
0 1 0 1 0 1 ln n
LightGBM_32_1h 0. 93 0. 93 0. 92 0. 96 0. 87 0. 94 0. 89 0. 03 1250
LightGBM_24_1h 0. 93 0. 94 0. 92 0. 96 0. 88 0. 95 0. 90 0. 2 1250
XGBoost_32_1h 0. 92 0. 94 0. 89 0. 94 0. 89 0. 94 0. 89 0. 2 20
XGBoost_24_1h 0. 94 0. 95 0. 92 0. 96 0. 91 0. 96 0. 92 0. 3 75
(2024)利用机器学习方法开展长江流域夏季降水 成密切相关(赵翠光等, 2022)。由此可见, 基于
延伸期预报试验, 并对三个最优机器学习模型的集 LightGBM 算法和 XGBoost 算法建立景德镇机场当
合计算不同预报因子的贡献大小, 探讨了长江流域 前低能见度的四个预测模型是具有物理意义的。
表层土壤湿度对长江流域延伸期降水的影响机理。 从图3可以看到, rh_ob的重要性在预报未来1 h
对于树类模型(XGBoost、 LightGBM 等), 可以通过 低能见度的模型中排名第一或第二, 且在重要性排名
模型的特征重要性(feature_importances)方法来获 前十的特征中, 相对湿度特征有2~3个, rh_ob和rh_
取特征重要性, 进而对比分析哪些预报因子比较重 1000均在其中, 说明地面及近地层大气的相对湿度
要。LightGBM 的 feature_importances 可以通过特 特征仍然是预报未来 1 h 低能见度的重要因子。同
征的分裂次数或使用该特征分裂后的增益来衡量, 时 , windspeed_ob、 wind_ob、 tmp_ob、 div_850、
XGBoost 的 feature_importances 可以通过特征在所 prmsl_ob这六个特征均在4个模型特征重要性排名前
有树中作为划分属性的次数、 利用该特征作为划分 十位之列。对比图2和图3, 无论预报当前低能见度
属性带来的平均增益或使用该特作为分割影响的 还是预报未来1 h低能见度现象, 重要性排名前十特
平均样本数来衡量。一般情况下, 不同的衡量准则 征中均有 rh_ob、 tmp_ob、 windspeed_ob, 其中 rh_ob
得到的特征重要性顺序会有差异, 本文使用分裂次 基本排名第1位; tmp_ob、 windspeed_ob两个特征在
数作为衡量特征重要性的准则。也就是说, 一个特 预测未来1 h低能见度的模型中重要性排名比预测当
征在模型中用来构建决策树的次数越多, 它的重要 前低能见度时排名靠前; vvel_925、 vvel_950、 div_
性就相对越高; 若一个特征在不同的模型中都是比 1000 三个特征对预测当前低能见度的模型更重要,
较重要的, 那么该特征对标签有较好的预测能力。 但div_850、 rh_1000、 prmsl_ob、 wind_ob四个特征对
由图 2 可知, 预报当前低能见度现象的四个模 预测未来1 h低能见度的模型更重要。由此可知, 无
型排名第一重要的特征都是 rh_ob, 且 EC 预报 925 论预报当前低能见度还是未来1 h低能见度, 地面相
hPa 相对湿度的重要性排名在四个模型位于前十, 对湿度都是最重要的因子, 在预报当前低能见时,
表明地面实际相对湿度和近地层的相对湿度对当 1000 hPa散度、 925 hPa和950 hPa垂直速度的重要性
前低能见有较好的预测能力, 且模型尤其依赖于地 更大, 但预报未来 1 h 低能见度时, 850 hPa 散度、
面实际相对湿度 rh_ob。刘季秋等(2023)根据浦东 1000 hPa相对湿度、 机场海平面气压和风向的重要性
机场 2000 -2019 年逐时观测资料, 统计低于 2 km 更大。这一区别对于机场预测未来1 h低能见度是否
的能见度与其他地面气象要素的关系, 发现低于 持续具有重要指导意义。
2 km 的能见度与相对湿度呈指数关系, 回归系数 R 张庆等(2024)基于 LightGBM 算法, 通过对比
为 0. 39, 通过了 α=0. 05 的显著性检验。这与本文 试验分批引入地面观测特征、 ERA5 再分析资料、
机器学习模型中最重要的特征是地面相对湿度相 经验因子、 经纬度因子建模, 结果表明增加 ERA5
符。同时, vvel_925 和 vvel_950、 tmp_ob 三个特征 等压面层物理量后 LightGBM 模型的性能显著提
的重要性均位于前五, windspeed_ob、 div_1000 两 升, 0~36 h内大雾预报的 TS达 0. 3以上。而本文同
个特征重要性位于前八, 说明近地层大气的垂直速 样基于 LIghtGBM 算法使用地面观测特征和 EC‐
度、 机场实际气温和风速、 1000 hPa 散度是预报低 MWF 预报特征建立的低能见度预报模型, TS 评分
能见度的重要因子(吴彬贵等, 2017), 而这些因子 为 0. 84 和 0. 81。除去多站样本和预报时效两者的
反映的是近地面气层的层结条件, 与低能见度的形 不同, 本文在模型输入因子中增加了 1000 hPa、

