Page 195 - 《高原气象》2026年第2期
P. 195
2 期 殷齐娥等:基于机器学习的机场低能见度短临预报研究 495
件, 因此在构造样本时需要剔除因为降水导致的低 预测时, 特征的SHPA值表现得不够集中。
能见度。张庆等(2024)在研究京津冀地区低能见 对比 LightGBM_24 模型对不同时效低能见度
-1
度时, 将小时降水量高于 0. 5 mm·h 的样本进行剔 的预测评估指标(表 6)发现, LightGBM_24 模型的
除, 但将该阈值用于景德镇机场低能见度预测建模 预报准确率在 5 h 以内均在 0. 84 以上, 随着预报时
时, 发现特征的 SHAP 值较为分散, “膨大”现象并 效增加, 模型的预报准确率逐渐降低。虽然模型对
不明显(图略), 分析原因与南北方地区的低能见度 非低能见度的综合预报能力在第 5 h 降低最明显,
和降水地域性有关, 弱降水导致的雨雾与辐射雾的 低于 0. 90, 但预报低能见度的综合能力始终保持在
形成机制也不一样, 因此在运用 SHAP 值解释模型 0. 84以上, 预报也是有一定可用性的。
表6 LIghtGBM_24模型对不同预报时效低能见度的预报准确率对比
Table 6 Classification reports of LightGBM_24 for various forecast times
精确率 召回率 F1_score 最佳参数
预报时效 准确率
0 1 0 1 0 1 ln n
LightGBM_24_0h 0. 93 0. 96 0. 90 0. 94 0. 93 0. 95 0. 92 0. 1 500
LightGBM_24_1h 0. 93 0. 94 0. 92 0. 96 0. 88 0. 95 0. 90 0. 2 1250
LightGBM_24_2h 0. 94 0. 97 0. 89 0. 93 0. 95 0. 95 0. 92 0. 01 900
LightGBM_24_3h 0. 88 0. 92 0. 82 0. 89 0. 86 0. 90 0. 84 0. 1 200
LightGBM_24_4h 0. 91 0. 94 0. 85 0. 91 0. 90 0. 93 0. 88 0. 02 900
LightGBM_24_5h 0. 84 0. 87 0. 87 0. 79 0. 88 0. 78 0. 88 0. 2 50
4. 2 结论 的误报率, 其中, XGBoost 算法模型的性能提高更
本文基于机场观测数据和 EC 模式预报产品, 大, LightGBM 算法的性能更稳定, 在时间方面更
建立 LightGBM 算法和 XGBoost 算法机器学习模 具优势, 更适合用于搭建中小机场低能见度预报
型, 对机场当前低能见度和未来 1 h 低能见度现象 模型。
进行二分类预测, 根据特征相关系数剔除部分特 (3) 文中使用分裂次数作为衡量特征重要性
征, 对比不同机器学习模型的预报性能和稳定性, 的准则, 不同模型均认为机场当前实测相对湿度是
以挑选适合机场低能见度短临预报的机器学习模 预测短时间内低能见度事件最重要的特征。在通
型, 并采用 SHAP 值对 LightGBM 算法模型进行解 过 SHAP 值分析 LightGBM 算法模型的特征重要性
释, 对比分析不同标准下特征的重要性及其对模型 时, 当前实测相对湿度的特征重要性占比 39%, 排
预测的贡献。主要结论如下: 名第一。其次, 机场实测相对湿度、 风速、 海平面
(1) 特征筛选前后, 预测当前低能见度和未来 气压和 EC 预报的近地面相对湿度、 垂直速度、 散
度都是最重要的特征, 且散度作为特征输入可以极
1 h 低能见的 LightGBM 算法和 XGBoost 算法模型
大提高模型性能。
ROC 曲线均靠近左上角, AUC 为 0. 98, 表明两种
(4) 根据模型预报当前和未来 1 h 低能见度的
算法模型对于机场低能见度分类预测性能良好。
主要特征差异可知, 对于未来 1 h 低能见度的预
我国大部分机场都有其特殊的环境, 低能见度事件
报, 需要重点关注 850 hPa 散度、 1000 hPa 相对湿
的发生与其显著的局地性和地域性特征密切相关,
度、 机场海平面气压和风向的变化。这符合工作经
机器学习模型可以地关注机场独特的微小气候环
验, 但如何根据这些特征预报未来 1 h 低能见度是
境, 也能从较大尺度环流背景中学习低能见度发生
否持续, 有待进一步研究。
的规律, 能有效弥补机场预报员预报经验的不足,
提高机场预报准确性。 参考文献(References):
(2) 依据特征的相关性进行特征筛选后, 不同
Chen T Q, Guestrin C, 2016. XGBoost: a scalable tree boosting sys‐
算法模型综合性能均有提高, 对于当前低能见度的
tem[C]. In Proceedings of the 22nd ACM SIGKDD International
预测, 主要表现为减少低能见度的漏报率, 对于未 Conference on Knowledge Discovery and Data Mining, 785-
来 1 h 低能见度的预报, 主要表现为减少低能见度 794. DOI: 10. 1145/2939672. 2939785.

