Page 122 - 《高原气象》2025年第6期
P. 122
高 原 气 象 44 卷
1530
据, 利用热力条件、 水汽条件、 动力条件和特性高 (4) 通过对 ERA5 特征因子的核密度估计曲线
度层这些特征因子, 通过决策树算法建立特征因子 分析发现, p54. 162 和 p60. 162 在冰雹样本和非冰
与冰雹标签之间的非线性映射关系。决策树算法 雹样本中呈现较大的区分性, 冰雹样本数据中的
通过递归的特征空间二分划分, 形成树状结构模 p54. 162 和 p60. 162 特征因子呈现出多个与非冰雹
型, 根据设定的阈值得到最终的冰雹标签预测值, 数据不同的峰值。并且, 冰雹样本数据的 d2m 特征
得到以下主要结论: 因子的峰值主要集中在 260~290 之间, 而非冰雹样
(1) 本研究构建的决策树模型可将数值天气 本数据的 d2m 特征因子的峰值主要集中在 230~300
预报场作为输入特征, 充分考虑青海省高原复杂地 之间。这三个特征因子可以作为主观冰雹预测的
形的影响, 实现对研究区域的冰雹天气潜势预报。 优选指标。然后其他大部分特征因子的核密度估
模型输出的概率预报值可为业务预警提供客观的 计曲线并未呈现出明显的分离性, 可以看出单一特
定量参考依据, 有助于提升冰雹天气的预警能力。 征因子很难对冰雹天气的产生决定性影响。
(2) 通过对随机森林、 XGBoost 和 LightGBM (5) 实例分析表明, LightGBM 算法预测的高
三种决策树模型进行系统评估, 采用命中率、 虚警 冰雹概率区域与实际地面观测到的冰雹区域吻合
率、 临界成功指数、 准确率和召回率等多维指标进 度较高。根据对 2017年 7月 9日青海省泽库站和茶
行性能对比。结果表明, 随机森林模型在预报效果 卡站部分因子的分析, 茶卡站发生较大冰雹(8
和计算效率方面均表现欠佳。XGBoost 和 LightG‐ mm)的原因可能与更强烈的对流活动、 更大的
BM 两 种 算 法 都 展 现 出 良 好 的 预 报 能 力 , 其 中 p54. 162 波动以及更高的空气湿度(较高的 d2m 值)
LightGBM 算法在预报性能和计算效率上具有明显 相关。此外, 茶卡站在 11:00 的较大 u500 的值和较
优势。特别值得注意的是, 在针对冰雹直径≥2 mm 低的 t100值, 进一步表明该地区存在更强的对流活
和≥5 mm 两组独立测试集的验证中, LightGBM 模 动, 促使水滴冻结并形成较大的冰雹。
型对较大尺度冰雹(直径≥5 mm)的预报效果优于小 综上所述, 冰雹属于强对流天气现象, 具有极
尺度冰雹(直径≥2 mm), 表现出对强度较大冰雹天
大的破坏性和危险性。本研究旨在发现气象特征
气的优异识别能力。本研究进一步探讨了 LightG‐
因子与冰雹之间的非线性关系, 以期较好地预测冰
BM 模型在预测更大尺度冰雹(直径≥10 mm 和直径
雹天气, 从而减小其带来的危害。但受限于冰雹样
≥20 mm)时的性能表现。实验结果表明, 随着冰雹
本数量, 决策树算法在训练时难以充分建立特征因
直径的增加, 模型的平均命中率、 临界成功指数等
子与冰雹标签之间的映射关系, 导致存在一定误报
关键指标仍然保持在较高水平, 表明该方法在不同
情况。为进一步提升模型性能, 可利用冰雹高发区
尺度冰雹预测任务中的适用性。然而, 相较于直径
域的冰雹样本增强模型训练, 同时提高地面气象站
≥2 mm 和≥5 mm 的实验结果, 较大冰雹样本的误报
的观测技术, 提高青海省冰雹灾情报告的质量, 为
率仍然存在一定的提升空间, 表明模型在极端冰雹
青海省区域获取更多冰雹样本, 从而降低误报率,
事件上的判别能力可能受到数据样本量、 特征表达
提高预测精确度。
能力及非均衡分布的影响。
(3) 通过对基于 LightGBM 模型的特征重要性 参考文献(References):
分析表明, 在两组实验中, 温度垂直积分、 热能垂
Ahmad H, 2019. Machine learning applications in oceanography[J].
直积分、 2 m 露点温度等热力条件因子始终占据主
Aquatic Research, 2(3): 161-169.
导地位, 其中在直径≥2 mm 的实验中, 热力条件的
Chen T, Guestrin C, 2016. Xgboost: A scalable tree boosting system
贡献度超过 50%。值得注意的是, 在直径≥5 mm 的 [C]//Proceedings of the 22nd acm sigkdd international confer‐
实验中, 500 hPa 东西向风速、 200 hPa 风的南北方 ence on knowledge discovery and data mining, 785-794.
向分量等动力条件因子的重要性显著提升, 同时特 Chen X, Wang H, Zhen F, et al, 2022. Hail disaster recognition
性高度层的贡献度也相应增加, 表明较大尺度冰雹 method based on artificial intelligence with Doppler radar data
[J]. Journal of Applied Remote Sensing, 16(1): 014519-
的形成机制更依赖于强动力系统的配置。这一结
014519.
果不仅揭示了不同尺度冰雹形成的关键影响因子,
Ke G, Meng Q, Finley T, et al, 2017. Lightgbm: a highly efficient
也为提高冰雹预报的针对性提供了重要的科学 gradient boosting decision tree[J]. Advances in Neural Informa‐
依据。 tion Processing Systems, 30.

