Page 119 - 《高原气象》2025年第6期
P. 119

6 期               刘  杰等:基于决策树算法的青海省高原地区冰雹预报及关键特征因子分析                                       1527
               特征因子重要性得分的分析可以看出, 尽管冰雹样                           据点 x , x , …, x , 应用高斯核函数计算每一点处
                                                                                 i
                                                                          2
                                                                      1
               本直径的阈值不同, 各类关键特征因子在模型预测                           的概率密度值 K(x)(式 6), 其中 x 代表每个数据点
               中的贡献呈现出一定的差异, 但热力条件始终在冰                           距离该点的偏移量。然后再对所有点的概率密度
               雹预测中占据主导地位, 特别是在直径≥2 mm 的实                        值进行加权平均, 得到整体的概率密度估计。从密
               验中表现尤为显著。同时, 动力条件和特性高度层                           度估计曲线可以看出数据的分布特征。
                                                                                                x
                                                                                                 2
               的重要性在直径≥5 mm 的实验中更加突出, 表明较                                             1     ( )
                                                                             K ( x ) =   exp -             (6)
               大直径冰雹的形成与更强的动力驱动和特定高度                                                  2π        2
               层的显著气象特征密切相关。                                         图 7展示了部分特征因子的概率密度估计曲线
                   温 度 垂 直 积 分(p54. 162)、  热 能 垂 直 积 分           图, 实线代表冰雹样本数据(包含直径≥2 mm 和
              (p60. 162)和 2 m 露点温度(d2m)这些热力条件在                   ≥5 mm 的所有样本), 虚线为非冰雹样本数据。从
               LightGBM 算法模型中的重要性得分最高, 温度和                       图 7 中可以看出, 重要性评分排名靠前的 p54. 162、
               热能垂直积分直接反映了大气层结的热力学状态                             p60. 162 和 d2m 这些特征因子在核密度曲线上, 两
               和不稳定性, 2 m 露点温度代表了地面附近的水汽                         种样本数据的曲线具有不同的分布特征, 冰雹样本
               含量, 这些都是影响冰雹形成和发展的关键条件;                           数据中的 p54. 162 和 p60. 162 特征因子呈现出多
               200 hPa和 500 hPa在垂直方向上的风速的差异导致                    个与非冰雹数据不同的峰值, 冰雹样本数据的 d2m
               风切变, 强烈的垂直风切变有利于对流系统的发展                           特征因子的峰值主要集中在 260~290, 而非冰雹样
               和组织化(刘莲等, 2015), 并且较强的垂直风切变                       本数据的 d2m 特征因子的峰值主要集中在 230~300
               对飑线发展和维持具有重要影响, 飑线是一种线型                           之 间 ,  体 现 出 较 高 的 区 分 度 ,  表 明 p54. 162、
               强对流云带, 容易带来冰雹等天气(Meifang et al,                   p60. 162 和 d2m 对冰雹事件的分离能力较强, 可作
               2021), 这与模型赋予 u500、 v200 和 u200 动力条件              为主观冰雹预测的优选指标。其他大部分特征因
               较高的重要性相吻合。特性高度层因子中, t100、                         子的核密度估计曲线并未呈现出明显的分离性, 这
               t400 和 z20 排名较前, 100 hPa 与平流层相对应,                 反映了导致冰雹发生的大气环境条件的高度复杂
               400 hPa 对应于较高的高空大气层, 两个温度层关                       性。冰雹天气是多种复杂环境因素共同作用的结
               系到大气的稳定性和湿度分布, 进而促进冰雹天气                           果, 单一特征因子很难对其产生决定性影响。只有
               的形成和发展, 20 hPa 的位势高度反映了高空大气                       将多个关键特征综合考虑, 并能够捕捉它们之间的
               环流的情况, 也会影响冰雹天气的发生。                               相互作用和非线性组合关系, 才能更准确地刻画出
                   在山东半岛基于随机森林算法的冰雹预报模                           有利于冰雹形成的大气环境条件, 从而提高预测的
               式中, 最重要的特征因子集中在对流层中下层, 主                          精确度(Martius et al, 2018)。
               要包括最佳对流有效势能、 -20 ℃、 -10 ℃和 0 ℃                        LightGBM 模型采用了决策树作为基学习器,
               等 温 线 高 度 ,  以 及 700  hPa 温 度 场(Yao  et  al,      这种非参数非线性模型具备强大的数据拟合能力。

               2020), 这些主要反映了中低层大气的热力状态和                         通过组合多棵决策树, LightGBM 模型能够有效捕
               对流不稳定性, 是影响冰雹发生发展的关键热力学                           捉多个特征因子之间的复杂关系。
               条件。然而, 在高原复杂地形环境下, 尤其是青海                          3. 4 实例分析
               省区域, 冰雹天气系统的主控因子发生了明显转                                2017 年 7 月 9 日, 青海省多个地区遭遇了严重
               变。虽然热力条件和特性高度层等仍然扮演重要                             的冰雹天气, 其中泽库站点记录的冰雹直径为
               角色, 但主要集中在对流层中上层乃至平流层底                            3 mm, 茶卡站点的冰雹直径为 8 mm。图 8 展示了
               部, 如 100 hPa和 400 hPa温度场、 200~500 hPa风场           当日泽库站和茶卡站的 p54. 162和 d2m 的 24 h变化
               等。这种差异反映了高原地区独特的地形影响, 中                           折线图, 图 9展示了当日泽库站和茶卡站的 u500和
               高层大气环流和动力学因子在推动冰雹云系发展                             t100的24 h变化折线图。
               过程中扮演更加重要的角色。                                         从图 8 可以看出, 泽库站和茶卡站在 11:00(北
               3. 3 特征因子概率密度估计曲线分析                               京时, 下同)左右均出现了 p54. 162值的波动, 并且
                   核密度估计曲线提供了数据的概率密度估计,                          伴随较高的 d2m 值。p54. 162 的波动可能表明强烈
               即在每个点处数据出现的概率密度。对于每个数                             的对流活动发生, 云顶温度较低, 形成了冰雹所需
   114   115   116   117   118   119   120   121   122   123   124