Page 193 - 《高原气象》2026年第2期
P. 193
2 期 殷齐娥等:基于机器学习的机场低能见度短临预报研究 493
图3 特征筛选前后LightGBM(a、 b)和XGBoost(c、 d)预测未来1 h出现低能见度的特征重要性
Fig. 3 The feature importance of LightGBM algorithm (a, b) and XGBoost algorithm (c, d)
in predicting the low visibility in an hour by feature screening
其余大值样本集中在正贡献侧, 且特征值越大对预 型预测的贡献小。取每个特征的 SHAP值的绝对平
测的正贡献越大, 甚至 SHAP 值集中在 10~15, 说 均值作为该特征的重要性[图4(b)], rh_ob的重要性
明地面相对湿度对预测低能见度的影响最大, 且为 排名第一, 占比 39%, 前十个特征重要性累计占比
正贡献, 即地面相对湿度较低时低能见度几乎不会 80%, 满足对模型解释的需求。对比图 4(b)与图 3
出现, 随着地面相对湿度增大, 出现低能见度的可 (b), 在不同特征重要性准则下rh_ob、 tmp_ob、 wind‐
能 性 越 大 。 其 他 重 要 性 前 十 特 征 中 , tmp_ob、 speed_ob、 prmsl_ob、 rh_1000、 vvel_925、 wind_ob、
prmsl_ob、 windspeed_ob、 wind_ob、 div_1000 特 征 div_925、 div_850九个特征重要性均排名前十。
的小值样本集中在正贡献侧, 大值样本集中在负贡 图 5 和图 6 详细展示了一个低能见度样本(正
献侧, 说明气温低、 风速小、 近地层大气散度小或 样本)和一个非低能见度样本(负样本)的每个特征
辐合会增加低能见度的可能性, 较高的取值则减小 对预测结果的贡献, 基本值(base alue)是模型对样
低能见度的可能性。而 rh_1000、 div_925 的大值样 本集预测值的均值, f(x)(model output)表示模型预
本集中在正贡献侧, vvel_925 的弱值样本集中在正 测目标的输出值, 颜色和箭头表示特征将模型的预
贡献侧, 表明近地层相对湿度高、 低层大气散度 测结果从基本值推动到最终的取值 f(x): 将预测推
大、 垂直运动弱有利于低能见度发生。特征在 高的特征用红色表示, 将预测推低的特征用蓝色表
SHAP 值为 0 的地方出现“膨大”, 表明该特征对模 示, 且特征的长度越长, 对预测的影响越大。从图

