Page 112 - 《高原气象》2025年第6期
P. 112
高 原 气 象 44 卷
1520
1 引言 等, 2021)。Yao et al (2020)基于再分析资料计算
的对流指数, 结合随机森林算法在山东半岛地区的
冰雹是一种常见的气象自然灾害, 其发生往往
冰雹识别中取得了良好效果。此外, 袁凯等(2023)
伴随着雷暴、 大风、 龙卷风和山洪暴发, 造成人员
基于鄂东地区的冰雹灾情资料、 武汉多普勒雷达和
伤亡和财产损失(Prein and Holland, 2018)。局部
探空数据, 探讨了决策树算法在冰雹识别中的应
地区的意外冰雹可能造成巨大的物质和经济损失,
用, 验证了其强大的识别能力。这些研究初步验证
甚至对人员造成严重伤害(Kim et al, 2023)。中国 了机器学习技术, 尤其是决策树算法, 在提升极端
将直径大于 2 mm 的球状或不规则冰块形式的降水
天气预报准确性方面的潜力。虽然深度学习模型
定义为冰雹, 将落到地面上直径不小于 2 cm 的冰 在多个领域表现出较高的性能, 但其高度非线性的
雹称为强对流天气之一(赵文慧等, 2019; 俞小鼎 复杂性限制了其可解释性(杨朋波等, 2021)。与之
和 郑 永 光 , 2020)。 在 国 际 上 , 世 界 气 象 组 织
相比, 传统机器学习算法能在小规模冰雹数据集上
(WMO)建议将直径大于等于 5 mm 的冰雹定义为 更有效地避免过拟合, 捕捉冰雹形成的普遍规律,
地面冰雹, 但不同国家和研究中对冰雹尺寸的界定 提供对关键气象因子的识别与作用机理的深入理
标准并不完全统一(Punge and Kunz, 2016; Rana et 解。这为冰雹等极端天气现象的预测提供了有力
al, 2022)。中国年平均冰雹频率最高的地区主要 支持。
集中在青藏高原, 这一分布特征与当地的地形条件 青海省区域地处 3000~5000 m 的高原地带, 冰
密切相关。该地区的高海拔地形为冰雹的形成提 雹天气频发, 但与我国东部低海拔地区不同, 该区
供了理想的上升气流条件(赵文慧等, 2019)。青海 的冰雹粒径较小、 局地性强(马晓玲等, 2020), 由
省位于青藏高原东北部, 地处 3000~5000 m 的高原 于该区独特的地理环境和气候特点, 雷暴、 冰雹等
地带, 是我国强对流天气高发区域之一。该区域不 对流天气也呈现出特殊性(李典等, 2014; 阮悦等,
仅地理环境独特, 还汇聚了长江、 黄河、 澜沧江三 2018)。然而, 目前针对中国高原区域的冰雹预测
大河流的发源地, 使其在对流天气形成与演变过程 研究仍显不足, 尤其是专门针对青海省这一特殊区
中具有特殊的地理和环境条件。鉴于该地区平均 域的相关研究成果还相对匮乏。鉴于青海省地理
海拔的高度以及独特的地形地貌, 当地冰雹等强对 环境的特殊性, 本研究旨在构建面向该区域的冰雹
流天气现象的生成与发展机理也呈现出与其他地 机器学习预报模型, 利用欧洲中期天气预报中心
区显著不同的特征(马晓玲等, 2020)。 (ECMWF)发布的 ERA5 数据, 结合青海省地面气
近年来, 机器学习在气象数据分析中取得了显 象站和灾情直报系统的历史冰雹数据, 采用决策树
著进展, 能够捕捉输入与输出之间的非线性关系 算法对预报模型进行训练。与传统基于多普勒天
(Sarker, 2021)。机器学习作为人工智能的一个分 气雷达数据的冰雹预报[预报时效通常为 0~2 h
支, 能够训练出自变量和因变量之间的复杂非线性 (Chen et al, 2022)]不同, ERA5 数据具有更高的空
映射关系(Otchere et al, 2021; Ahmad, 2019), 研 间覆盖范围和时间连续性, 使得本研究构建的模型
究者利用机器学习从多源数据中提取对流天气的 能够结合数值天气预报产品, 实现任意预报时效的
关键特征, 提升了对强对流天气系统的监测能力 冰雹潜势预报, 其关键在于获取相应时段的气象特
(Sui et al, 2021)。此外, 研究人员还利用机器学习 征因子数据。本研究探讨了三种不同决策树算法
技术从卫星云图、 雷达图等多源数据中提取对流天 在青海省冰雹预报任务中的适用性, 通过对比评
气的关键特征, 这些特征对于识别和监测强对流天 估, 确定了 LightGBM 模型表现最为优异。该研究
气系统至关重要(McGovern et al, 2017; Reichstein 分别针对直径大于 2 mm 和 5 mm 的冰雹开展了预
et al, 2019; 匡秋明等, 2017)。 报研究。基于 LightGBM 模型, 深入分析了冰雹预
尽管如此, 冰雹和雷暴大风等局地极端天气的 测中的关键特征因子, 并利用核密度估计曲线分析
预报仍具挑战性, 尤其是这些现象常超出现有气象 了这些因子的分布特征, 同时通过热力图可视化了
观测网络的覆盖(Zheng et al, 2017), 目前在冰雹 冰雹发生时关键特征因子的分布情况。结果表明,
预报方面的应用研究成果还相对薄弱。已有研究 本研究所提出的面向不同尺度冰雹的机器学习预
表明, 基于 C 波段雷达产品和地面观测数据构建的 报模型不仅具备较强的冰雹识别能力, 而且结合数
LightGBM 模型, 可以迅速、 有效地提高甘肃三个 值天气预报产品, 只要获取对应时段的气象特征因
地区冰雹等强对流天气的识别和预报能力(刘新伟 子数据, 就可以完成该时段的冰雹潜势预报。

