Page 195 - 《高原气象》2026年第2期
P. 195

2 期                       殷齐娥等:基于机器学习的机场低能见度短临预报研究                                         495
               件, 因此在构造样本时需要剔除因为降水导致的低                           预测时, 特征的SHPA值表现得不够集中。
               能见度。张庆等(2024)在研究京津冀地区低能见                              对比 LightGBM_24 模型对不同时效低能见度
                                               -1
               度时, 将小时降水量高于 0. 5 mm·h 的样本进行剔                     的预测评估指标(表 6)发现, LightGBM_24 模型的
               除, 但将该阈值用于景德镇机场低能见度预测建模                           预报准确率在 5 h 以内均在 0. 84 以上, 随着预报时
               时, 发现特征的 SHAP 值较为分散, “膨大”现象并                      效增加, 模型的预报准确率逐渐降低。虽然模型对
               不明显(图略), 分析原因与南北方地区的低能见度                          非低能见度的综合预报能力在第 5 h 降低最明显,
               和降水地域性有关, 弱降水导致的雨雾与辐射雾的                           低于 0. 90, 但预报低能见度的综合能力始终保持在
               形成机制也不一样, 因此在运用 SHAP 值解释模型                        0. 84以上, 预报也是有一定可用性的。

                                    表6  LIghtGBM_24模型对不同预报时效低能见度的预报准确率对比
                                  Table 6  Classification reports of LightGBM_24 for various forecast times
                                              精确率               召回率              F1_score          最佳参数
                   预报时效          准确率
                                            0        1        0       1        0        1        ln       n
                 LightGBM_24_0h  0. 93    0. 96    0. 90    0. 94    0. 93    0. 95    0. 92    0. 1     500
                 LightGBM_24_1h  0. 93    0. 94    0. 92    0. 96    0. 88    0. 95    0. 90    0. 2     1250
                 LightGBM_24_2h  0. 94    0. 97    0. 89    0. 93    0. 95    0. 95    0. 92    0. 01    900
                 LightGBM_24_3h  0. 88    0. 92    0. 82    0. 89    0. 86    0. 90    0. 84    0. 1     200
                 LightGBM_24_4h  0. 91    0. 94    0. 85    0. 91    0. 90    0. 93    0. 88    0. 02    900
                 LightGBM_24_5h  0. 84    0. 87    0. 87    0. 79    0. 88    0. 78    0. 88    0. 2      50

               4. 2 结论                                           的误报率, 其中, XGBoost 算法模型的性能提高更
                   本文基于机场观测数据和 EC 模式预报产品,                        大, LightGBM 算法的性能更稳定, 在时间方面更
               建立 LightGBM 算法和 XGBoost 算法机器学习模                   具优势, 更适合用于搭建中小机场低能见度预报
               型, 对机场当前低能见度和未来 1 h 低能见度现象                        模型。
               进行二分类预测, 根据特征相关系数剔除部分特                               (3)  文中使用分裂次数作为衡量特征重要性
               征, 对比不同机器学习模型的预报性能和稳定性,                           的准则, 不同模型均认为机场当前实测相对湿度是

               以挑选适合机场低能见度短临预报的机器学习模                             预测短时间内低能见度事件最重要的特征。在通
               型, 并采用 SHAP 值对 LightGBM 算法模型进行解                   过 SHAP 值分析 LightGBM 算法模型的特征重要性
               释, 对比分析不同标准下特征的重要性及其对模型                           时, 当前实测相对湿度的特征重要性占比 39%, 排
               预测的贡献。主要结论如下:                                     名第一。其次, 机场实测相对湿度、 风速、 海平面
                  (1)  特征筛选前后, 预测当前低能见度和未来                       气压和 EC 预报的近地面相对湿度、 垂直速度、 散
                                                                 度都是最重要的特征, 且散度作为特征输入可以极
               1 h 低能见的 LightGBM 算法和 XGBoost 算法模型
                                                                 大提高模型性能。
               ROC 曲线均靠近左上角, AUC 为 0. 98, 表明两种
                                                                    (4)  根据模型预报当前和未来 1 h 低能见度的
               算法模型对于机场低能见度分类预测性能良好。
                                                                 主要特征差异可知, 对于未来 1 h 低能见度的预
               我国大部分机场都有其特殊的环境, 低能见度事件
                                                                 报, 需要重点关注 850 hPa 散度、 1000 hPa 相对湿
               的发生与其显著的局地性和地域性特征密切相关,
                                                                 度、 机场海平面气压和风向的变化。这符合工作经
               机器学习模型可以地关注机场独特的微小气候环
                                                                 验, 但如何根据这些特征预报未来 1 h 低能见度是
               境, 也能从较大尺度环流背景中学习低能见度发生
                                                                 否持续, 有待进一步研究。
               的规律, 能有效弥补机场预报员预报经验的不足,
               提高机场预报准确性。                                        参考文献(References):
                  (2)  依据特征的相关性进行特征筛选后, 不同
                                                                 Chen T Q, Guestrin C, 2016. XGBoost: a scalable tree boosting sys‐
               算法模型综合性能均有提高, 对于当前低能见度的
                                                                    tem[C]. In Proceedings of the 22nd ACM SIGKDD International
               预测, 主要表现为减少低能见度的漏报率, 对于未                             Conference  on  Knowledge  Discovery  and  Data  Mining,  785-
               来 1 h 低能见度的预报, 主要表现为减少低能见度                           794. DOI: 10. 1145/2939672. 2939785.
   190   191   192   193   194   195   196   197   198   199   200