Page 195 - 《高原气象》2026年第2期

P. 195

2 期殷齐娥等：基于机器学习的机场低能见度短临预报研究 495
件，因此在构造样本时需要剔除因为降水导致的低预测时，特征的SHPA值表现得不够集中。
能见度。张庆等（2024）在研究京津冀地区低能见对比 LightGBM_24 模型对不同时效低能见度
-1
度时，将小时降水量高于 0. 5 mm·h 的样本进行剔的预测评估指标（表 6）发现， LightGBM_24 模型的
除，但将该阈值用于景德镇机场低能见度预测建模预报准确率在 5 h 以内均在 0. 84 以上，随着预报时
时，发现特征的 SHAP 值较为分散， “膨大”现象并效增加，模型的预报准确率逐渐降低。虽然模型对
不明显（图略），分析原因与南北方地区的低能见度非低能见度的综合预报能力在第 5 h 降低最明显，
和降水地域性有关，弱降水导致的雨雾与辐射雾的低于 0. 90，但预报低能见度的综合能力始终保持在
形成机制也不一样，因此在运用 SHAP 值解释模型 0. 84以上，预报也是有一定可用性的。

表6 LIghtGBM_24模型对不同预报时效低能见度的预报准确率对比
Table 6 Classification reports of LightGBM_24 for various forecast times
精确率召回率 F1_score 最佳参数
预报时效准确率
0 1 0 1 0 1 ln n
LightGBM_24_0h 0. 93 0. 96 0. 90 0. 94 0. 93 0. 95 0. 92 0. 1 500
LightGBM_24_1h 0. 93 0. 94 0. 92 0. 96 0. 88 0. 95 0. 90 0. 2 1250
LightGBM_24_2h 0. 94 0. 97 0. 89 0. 93 0. 95 0. 95 0. 92 0. 01 900
LightGBM_24_3h 0. 88 0. 92 0. 82 0. 89 0. 86 0. 90 0. 84 0. 1 200
LightGBM_24_4h 0. 91 0. 94 0. 85 0. 91 0. 90 0. 93 0. 88 0. 02 900
LightGBM_24_5h 0. 84 0. 87 0. 87 0. 79 0. 88 0. 78 0. 88 0. 2 50

4. 2 结论的误报率，其中， XGBoost 算法模型的性能提高更
本文基于机场观测数据和 EC 模式预报产品，大， LightGBM 算法的性能更稳定，在时间方面更
建立 LightGBM 算法和 XGBoost 算法机器学习模具优势，更适合用于搭建中小机场低能见度预报
型，对机场当前低能见度和未来 1 h 低能见度现象模型。
进行二分类预测，根据特征相关系数剔除部分特（3）文中使用分裂次数作为衡量特征重要性
征，对比不同机器学习模型的预报性能和稳定性，的准则，不同模型均认为机场当前实测相对湿度是

以挑选适合机场低能见度短临预报的机器学习模预测短时间内低能见度事件最重要的特征。在通
型，并采用 SHAP 值对 LightGBM 算法模型进行解过 SHAP 值分析 LightGBM 算法模型的特征重要性
释，对比分析不同标准下特征的重要性及其对模型时，当前实测相对湿度的特征重要性占比 39%，排
预测的贡献。主要结论如下：名第一。其次，机场实测相对湿度、风速、海平面
（1）特征筛选前后，预测当前低能见度和未来气压和 EC 预报的近地面相对湿度、垂直速度、散
度都是最重要的特征，且散度作为特征输入可以极
1 h 低能见的 LightGBM 算法和 XGBoost 算法模型
大提高模型性能。
ROC 曲线均靠近左上角， AUC 为 0. 98，表明两种
（4）根据模型预报当前和未来 1 h 低能见度的
算法模型对于机场低能见度分类预测性能良好。
主要特征差异可知，对于未来 1 h 低能见度的预
我国大部分机场都有其特殊的环境，低能见度事件
报，需要重点关注 850 hPa 散度、 1000 hPa 相对湿
的发生与其显著的局地性和地域性特征密切相关，
度、机场海平面气压和风向的变化。这符合工作经
机器学习模型可以地关注机场独特的微小气候环
验，但如何根据这些特征预报未来 1 h 低能见度是
境，也能从较大尺度环流背景中学习低能见度发生
否持续，有待进一步研究。
的规律，能有效弥补机场预报员预报经验的不足，
提高机场预报准确性。参考文献（References）：
（2）依据特征的相关性进行特征筛选后，不同
Chen T Q， Guestrin C， 2016. XGBoost： a scalable tree boosting sys‐
算法模型综合性能均有提高，对于当前低能见度的
tem［C］. In Proceedings of the 22nd ACM SIGKDD International
预测，主要表现为减少低能见度的漏报率，对于未 Conference on Knowledge Discovery and Data Mining， 785-
来 1 h 低能见度的预报，主要表现为减少低能见度 794. DOI： 10. 1145/2939672. 2939785.

190 191 192 193 194 195 196 197 198 199 200