Page 176 - 《高原气象》2025年第3期
P. 176

高     原      气     象                                 44 卷
              734
                  降水预报能力的客观评价是气象预报科研业                           al, 2009; Ahijevych et al, 2009; Ebert, 2010; Gille‐
             务中的重要课题(Schaefer, 1990; Baldwin and Kain,          land et al, 2010; 张宏芳等, 2021; Wu et al, 2020;
             2006; Brill and Mesinger, 2009; 张宏芳等, 2014;        潘留杰等, 2024a, 2024b)。宏观来看空间检验主要
             肖颖等, 2023; 谢泽明等, 2024; 刘雨萌等, 2025)。                包括: 属性判别法、 形变场法、 邻域法、 尺度分离
             为了准确评价降水的预报表现, 基于二分法列联                             法四类。这些检验方法放宽了预报和观测的匹配
             表 ,  在 点 对 点 对 比 的 基 础 上 定 义 诸 如 命 中 率             条件限制, 检验结果与预报员的主观判断更加吻
             (POD)、 空报率(FAR)、 预报偏差(Bias)、 TS 评分                 合, 广泛应用于 NWP 预报性能的诊断分析(Ma‐
             等一系列评分指数来判别模式的预报表现(Mason,                          son,  1989;  Brill  and  Mesinger,  2009;  刘 静 等 ,
             2004; Ebert et al, 2013), 在天气预报检验中有着广              2022)。但是, 空间检验受阈值条件、 参数设定、 个
             泛的应用, 其中, TS 评分也被称作临界成功指数                          性需求等因素影响, 其适用性需要多视角分析, 与
             CSI (Critical Success Index), 是降水预报检验中最            其相比, 传统二分法“点对点”检验的匹配精度更有
             重要的指标之一。二分法列联表检验最早被 Finley                         优势(薛春芳和潘留杰, 2016; 潘留杰等, 2023)。
             (1884)应用于龙卷的预报效果评估, 至今已经有一                         目前, 天气预报业务中, 二分法检验评分仍然是最
             百多年的历史。针对 Finley(1884)的检验工作,                       为重要的评价指标, 不足之处在于没有考虑不同降
             Gillbert (1884)注意到因为检验中包含大量的预报                     水量数值的影响, 特别是就TS评分计算来说, 空报
             无龙卷, 事实也未观测到龙卷事件发生的样本, 采                           和漏报具有相同的地位, 事实上, 强降水的漏报往
             用准确率不能反映真实的预报能力, 并建议在检验                            往造成严重的灾害事故。本文在传统二分法检验
             中不考虑“正确预报未发生事件的样本”, 进而定义                           TS 评分的基础上, 提出了基于影响的降水预报评
             了 CSI检验公式。随后降水检验中也发现存在类似                           分 ITS (Impact Threat Score), 以期为降水二分法检
             情况, 未预报降水也没有观测到降水的事件样本在                            验提供更加丰富的判别标准。
             降水检验中占比非常大, 客观反映降水预报能力应
             该去除这类样本, 因此定义了威胁评分TS。                              2  传统二分法预报评分
                  近几十年来, 气象观测手段和天气预报能力快                         2. 1 二分法TS评分
             速发展。一方面, 地面气象观测站点更加稠密, 卫
                                                                    按照是否满足给定的阈值, 可以对降水事件进
             星、 雷达等遥感探测设备还能够在空间上作为地面
                                                                行“0” “1”标记。对于预报和观测降水来说, 可以
             气象观测站点的有效补充, 进而可以观测到更加局
                                                                有 4 种组合(表 1), 即: A 同时满足阈值条件; B 预
             地的降水信息; 另一方面, 数值天气预报 NWP
                                                                报满足阈值条件, 观测不满足; C 预报不满足阈值
             (Numerical Weather Forecast )的水平网格间距越来
                                                                条件, 观测满足; D 预报和观测同时不满足阈值条
             越小, 模式中的积云参数化方案逐渐被能够更加精
                                                                件。对关注范围内的所有站点或格点统计计算, 进
             细描述小尺度大气动力框架的“允许对流”CAM
                                                                而定义预报评分。通常, A 和 B 分别被称为命中和
             (Convection Allowing Model) 模型所替代, 能更清
                                                                空报的次数, C 为漏报的次数, D 为正确预报未出
             楚地表达四维空间中天气要素的中小尺度信息, 提
                                                                现的次数。
             供更多的预报细节; 但 CAM 模型对中小尺度天气
             结构的不精确描述, 细小的相位误差可能导致空间                                           表1  二分类列联表
             上高可变性的要素预报出现更大的强度、 形态等预                               Table 1  The binary classification contingency table
             报误差。有研究表明(Mass et al, 2002), 高分辨率                                        观测发生         观测未发生
             模 式 通 常 比 粗 分 辨 率 NWP 的 RMSE(Root Mean                 预报事件发生              A             B
             Squared Error) 更大, 即使是相对平滑的高空风场                       预报事件未发生              C             D
             或温度场。这是因为就 RMSE 的定义来说, 相对平
                                                                    根据事件分类, 常用的评分指数命中率 POD、
             滑的要素场对减小 RMSE 更有利, 而更高的水平分
                                                                空报率 FAR、 漏报率 MAR(Sprenger et al, 2017)、
             辨率必然意味着包括了更多的细节和局地预报信
                                                                Bias和TS评分的定义如下:
             息。这些细节或局地预报信息可能不正确, 在这种
                                                                                          A
             情况下, 细节信息就转化为噪音。                                                    POD =                    (1)
                                                                                        A + C
                  为了增强高分辨率 NWP 的预报检验能力, 气                                                B
                                                                                 FAR =                    (2)
             象工作者发展了一系列空间检验方法(Gilleland et                                             A + B
   171   172   173   174   175   176   177   178   179   180   181