Page 119 - 《高原气象》2025年第6期
P. 119
6 期 刘 杰等:基于决策树算法的青海省高原地区冰雹预报及关键特征因子分析 1527
特征因子重要性得分的分析可以看出, 尽管冰雹样 据点 x , x , …, x , 应用高斯核函数计算每一点处
i
2
1
本直径的阈值不同, 各类关键特征因子在模型预测 的概率密度值 K(x)(式 6), 其中 x 代表每个数据点
中的贡献呈现出一定的差异, 但热力条件始终在冰 距离该点的偏移量。然后再对所有点的概率密度
雹预测中占据主导地位, 特别是在直径≥2 mm 的实 值进行加权平均, 得到整体的概率密度估计。从密
验中表现尤为显著。同时, 动力条件和特性高度层 度估计曲线可以看出数据的分布特征。
x
2
的重要性在直径≥5 mm 的实验中更加突出, 表明较 1 ( )
K ( x ) = exp - (6)
大直径冰雹的形成与更强的动力驱动和特定高度 2π 2
层的显著气象特征密切相关。 图 7展示了部分特征因子的概率密度估计曲线
温 度 垂 直 积 分(p54. 162)、 热 能 垂 直 积 分 图, 实线代表冰雹样本数据(包含直径≥2 mm 和
(p60. 162)和 2 m 露点温度(d2m)这些热力条件在 ≥5 mm 的所有样本), 虚线为非冰雹样本数据。从
LightGBM 算法模型中的重要性得分最高, 温度和 图 7 中可以看出, 重要性评分排名靠前的 p54. 162、
热能垂直积分直接反映了大气层结的热力学状态 p60. 162 和 d2m 这些特征因子在核密度曲线上, 两
和不稳定性, 2 m 露点温度代表了地面附近的水汽 种样本数据的曲线具有不同的分布特征, 冰雹样本
含量, 这些都是影响冰雹形成和发展的关键条件; 数据中的 p54. 162 和 p60. 162 特征因子呈现出多
200 hPa和 500 hPa在垂直方向上的风速的差异导致 个与非冰雹数据不同的峰值, 冰雹样本数据的 d2m
风切变, 强烈的垂直风切变有利于对流系统的发展 特征因子的峰值主要集中在 260~290, 而非冰雹样
和组织化(刘莲等, 2015), 并且较强的垂直风切变 本数据的 d2m 特征因子的峰值主要集中在 230~300
对飑线发展和维持具有重要影响, 飑线是一种线型 之 间 , 体 现 出 较 高 的 区 分 度 , 表 明 p54. 162、
强对流云带, 容易带来冰雹等天气(Meifang et al, p60. 162 和 d2m 对冰雹事件的分离能力较强, 可作
2021), 这与模型赋予 u500、 v200 和 u200 动力条件 为主观冰雹预测的优选指标。其他大部分特征因
较高的重要性相吻合。特性高度层因子中, t100、 子的核密度估计曲线并未呈现出明显的分离性, 这
t400 和 z20 排名较前, 100 hPa 与平流层相对应, 反映了导致冰雹发生的大气环境条件的高度复杂
400 hPa 对应于较高的高空大气层, 两个温度层关 性。冰雹天气是多种复杂环境因素共同作用的结
系到大气的稳定性和湿度分布, 进而促进冰雹天气 果, 单一特征因子很难对其产生决定性影响。只有
的形成和发展, 20 hPa 的位势高度反映了高空大气 将多个关键特征综合考虑, 并能够捕捉它们之间的
环流的情况, 也会影响冰雹天气的发生。 相互作用和非线性组合关系, 才能更准确地刻画出
在山东半岛基于随机森林算法的冰雹预报模 有利于冰雹形成的大气环境条件, 从而提高预测的
式中, 最重要的特征因子集中在对流层中下层, 主 精确度(Martius et al, 2018)。
要包括最佳对流有效势能、 -20 ℃、 -10 ℃和 0 ℃ LightGBM 模型采用了决策树作为基学习器,
等 温 线 高 度 , 以 及 700 hPa 温 度 场(Yao et al, 这种非参数非线性模型具备强大的数据拟合能力。
2020), 这些主要反映了中低层大气的热力状态和 通过组合多棵决策树, LightGBM 模型能够有效捕
对流不稳定性, 是影响冰雹发生发展的关键热力学 捉多个特征因子之间的复杂关系。
条件。然而, 在高原复杂地形环境下, 尤其是青海 3. 4 实例分析
省区域, 冰雹天气系统的主控因子发生了明显转 2017 年 7 月 9 日, 青海省多个地区遭遇了严重
变。虽然热力条件和特性高度层等仍然扮演重要 的冰雹天气, 其中泽库站点记录的冰雹直径为
角色, 但主要集中在对流层中上层乃至平流层底 3 mm, 茶卡站点的冰雹直径为 8 mm。图 8 展示了
部, 如 100 hPa和 400 hPa温度场、 200~500 hPa风场 当日泽库站和茶卡站的 p54. 162和 d2m 的 24 h变化
等。这种差异反映了高原地区独特的地形影响, 中 折线图, 图 9展示了当日泽库站和茶卡站的 u500和
高层大气环流和动力学因子在推动冰雹云系发展 t100的24 h变化折线图。
过程中扮演更加重要的角色。 从图 8 可以看出, 泽库站和茶卡站在 11:00(北
3. 3 特征因子概率密度估计曲线分析 京时, 下同)左右均出现了 p54. 162值的波动, 并且
核密度估计曲线提供了数据的概率密度估计, 伴随较高的 d2m 值。p54. 162 的波动可能表明强烈
即在每个点处数据出现的概率密度。对于每个数 的对流活动发生, 云顶温度较低, 形成了冰雹所需

