Page 194 - 《高原气象》2026年第2期

P. 194

高原气象 45 卷
494

图4 LightGBM_24算法预测未来1 h低能见度模型中各特征的SHAP值（a）和重要性（b）
Fig. 4 SHAP values （a） and importance （b） of each feature in the low-visibility
LightGBM_24 algorithm model after one hour

图5 一个正样本特征的影响图
Fig. 5 Impact of each feature for a positive sample

图6 一个负样本特征的影响图
Fig. 6 Impact of each feature for a negative sample
5 和图 6 可知， LightGBM_24_1h 模型的基本值为增加，一方面这可能与样本量、特征数量少有关。

-7. 1，正样本的特征将预测输出值推高，负样本的例如 LightGBM 对站点最高、最低气温预报能力优
特征将预测输出值推低。图 5 正样本的 rh_ob 值为于主观预报，但当温度变化剧烈时，由于样本数较
97%，对预测的正影响最大，将 f（x）大幅度推高。少，机器学习方法可能会略差于主观预报（孙康慧
图 6 负样本的 rh_ob 值为 62%，对预测的负影响最等， 2024）。另一方面，也可能与 LightGBM 算法使
大，将f（x）大幅推低。用了独占特征绑定技术有关。独占特征绑定可以
有效地减少特征的数量，从而加速训练过程，这是
4 讨论和结论
LightGBM 算法比 XGBoost 算法效率高的原因之
4. 1 讨论一，但互斥特征的绑定有可能会忽视特征之间的微
在本文中， XGBoost 算法模型比 LightGBM 算小信息或特征之间的交互作用。
法模型评分高，特征筛选后模型的 F1_score 也有所本文主要考虑的是大雾天气造成低能见度事

189 190 191 192 193 194 195 196 197 198 199