Page 194 - 《高原气象》2026年第2期
P. 194

高     原      气     象                                 45 卷
              494




































                            图4 LightGBM_24算法预测未来1 h低能见度模型中各特征的SHAP值(a)和重要性(b)
                                Fig. 4 SHAP values (a) and importance (b) of each feature in the low-visibility
                                             LightGBM_24 algorithm model after one hour







                                                 图5 一个正样本特征的影响图
                                           Fig. 5 Impact of each feature for a positive sample







                                                 图6 一个负样本特征的影响图
                                           Fig. 6 Impact of each feature for a negative sample
             5 和图 6 可知, LightGBM_24_1h 模型的基本值为                  增加, 一方面这可能与样本量、 特征数量少有关。

             -7. 1, 正样本的特征将预测输出值推高, 负样本的                        例如 LightGBM 对站点最高、 最低气温预报能力优
             特征将预测输出值推低。图 5 正样本的 rh_ob 值为                       于主观预报, 但当温度变化剧烈时, 由于样本数较
             97%, 对预测的正影响最大, 将 f(x)大幅度推高。                       少, 机器学习方法可能会略差于主观预报(孙康慧
             图 6 负样本的 rh_ob 值为 62%, 对预测的负影响最                    等, 2024)。另一方面, 也可能与 LightGBM 算法使
             大, 将f(x)大幅推低。                                      用了独占特征绑定技术有关。独占特征绑定可以
                                                                有效地减少特征的数量, 从而加速训练过程, 这是
              4  讨论和结论
                                                                LightGBM 算法比 XGBoost 算法效率高的原因之
             4. 1 讨论                                            一, 但互斥特征的绑定有可能会忽视特征之间的微
                  在本文中, XGBoost 算法模型比 LightGBM 算                小信息或特征之间的交互作用。
             法模型评分高, 特征筛选后模型的 F1_score 也有所                          本文主要考虑的是大雾天气造成低能见度事
   189   190   191   192   193   194   195   196   197   198   199