Page 176 - 《高原气象》2025年第3期
P. 176
高 原 气 象 44 卷
734
降水预报能力的客观评价是气象预报科研业 al, 2009; Ahijevych et al, 2009; Ebert, 2010; Gille‐
务中的重要课题(Schaefer, 1990; Baldwin and Kain, land et al, 2010; 张宏芳等, 2021; Wu et al, 2020;
2006; Brill and Mesinger, 2009; 张宏芳等, 2014; 潘留杰等, 2024a, 2024b)。宏观来看空间检验主要
肖颖等, 2023; 谢泽明等, 2024; 刘雨萌等, 2025)。 包括: 属性判别法、 形变场法、 邻域法、 尺度分离
为了准确评价降水的预报表现, 基于二分法列联 法四类。这些检验方法放宽了预报和观测的匹配
表 , 在 点 对 点 对 比 的 基 础 上 定 义 诸 如 命 中 率 条件限制, 检验结果与预报员的主观判断更加吻
(POD)、 空报率(FAR)、 预报偏差(Bias)、 TS 评分 合, 广泛应用于 NWP 预报性能的诊断分析(Ma‐
等一系列评分指数来判别模式的预报表现(Mason, son, 1989; Brill and Mesinger, 2009; 刘 静 等 ,
2004; Ebert et al, 2013), 在天气预报检验中有着广 2022)。但是, 空间检验受阈值条件、 参数设定、 个
泛的应用, 其中, TS 评分也被称作临界成功指数 性需求等因素影响, 其适用性需要多视角分析, 与
CSI (Critical Success Index), 是降水预报检验中最 其相比, 传统二分法“点对点”检验的匹配精度更有
重要的指标之一。二分法列联表检验最早被 Finley 优势(薛春芳和潘留杰, 2016; 潘留杰等, 2023)。
(1884)应用于龙卷的预报效果评估, 至今已经有一 目前, 天气预报业务中, 二分法检验评分仍然是最
百多年的历史。针对 Finley(1884)的检验工作, 为重要的评价指标, 不足之处在于没有考虑不同降
Gillbert (1884)注意到因为检验中包含大量的预报 水量数值的影响, 特别是就TS评分计算来说, 空报
无龙卷, 事实也未观测到龙卷事件发生的样本, 采 和漏报具有相同的地位, 事实上, 强降水的漏报往
用准确率不能反映真实的预报能力, 并建议在检验 往造成严重的灾害事故。本文在传统二分法检验
中不考虑“正确预报未发生事件的样本”, 进而定义 TS 评分的基础上, 提出了基于影响的降水预报评
了 CSI检验公式。随后降水检验中也发现存在类似 分 ITS (Impact Threat Score), 以期为降水二分法检
情况, 未预报降水也没有观测到降水的事件样本在 验提供更加丰富的判别标准。
降水检验中占比非常大, 客观反映降水预报能力应
该去除这类样本, 因此定义了威胁评分TS。 2 传统二分法预报评分
近几十年来, 气象观测手段和天气预报能力快 2. 1 二分法TS评分
速发展。一方面, 地面气象观测站点更加稠密, 卫
按照是否满足给定的阈值, 可以对降水事件进
星、 雷达等遥感探测设备还能够在空间上作为地面
行“0” “1”标记。对于预报和观测降水来说, 可以
气象观测站点的有效补充, 进而可以观测到更加局
有 4 种组合(表 1), 即: A 同时满足阈值条件; B 预
地的降水信息; 另一方面, 数值天气预报 NWP
报满足阈值条件, 观测不满足; C 预报不满足阈值
(Numerical Weather Forecast )的水平网格间距越来
条件, 观测满足; D 预报和观测同时不满足阈值条
越小, 模式中的积云参数化方案逐渐被能够更加精
件。对关注范围内的所有站点或格点统计计算, 进
细描述小尺度大气动力框架的“允许对流”CAM
而定义预报评分。通常, A 和 B 分别被称为命中和
(Convection Allowing Model) 模型所替代, 能更清
空报的次数, C 为漏报的次数, D 为正确预报未出
楚地表达四维空间中天气要素的中小尺度信息, 提
现的次数。
供更多的预报细节; 但 CAM 模型对中小尺度天气
结构的不精确描述, 细小的相位误差可能导致空间 表1 二分类列联表
上高可变性的要素预报出现更大的强度、 形态等预 Table 1 The binary classification contingency table
报误差。有研究表明(Mass et al, 2002), 高分辨率 观测发生 观测未发生
模 式 通 常 比 粗 分 辨 率 NWP 的 RMSE(Root Mean 预报事件发生 A B
Squared Error) 更大, 即使是相对平滑的高空风场 预报事件未发生 C D
或温度场。这是因为就 RMSE 的定义来说, 相对平
根据事件分类, 常用的评分指数命中率 POD、
滑的要素场对减小 RMSE 更有利, 而更高的水平分
空报率 FAR、 漏报率 MAR(Sprenger et al, 2017)、
辨率必然意味着包括了更多的细节和局地预报信
Bias和TS评分的定义如下:
息。这些细节或局地预报信息可能不正确, 在这种
A
情况下, 细节信息就转化为噪音。 POD = (1)
A + C
为了增强高分辨率 NWP 的预报检验能力, 气 B
FAR = (2)
象工作者发展了一系列空间检验方法(Gilleland et A + B