Page 139 - 《高原气象》2025年第3期
P. 139

3 期               张淏元等:基于深度学习提升中国西南地区夏季降水短期气候预测的研究                                         697
               上的降水量。所以, 训练数据的时间范围为 1982 -                                       | | |  N  N        | | |
               2018 年间每年夏季(5 月 1 日至 9 月 30 日)的降水数                                | |∑ y i - ∑ p i   | | | |
                                                                                 | |
                                                                           Bias =  i = 1  i = 1  × 100%    (3)
                                                                                      N
               据, 共涵盖了 5661天的降水记录, 再将这些降水数                                       | | | |  ∑ p i     | | | |
               据转换为矩阵的形式并按时间顺序排列, 构成了最                                           |   i = 1          |
                                                                                     1  N
               终的训练集数据。随后, 将这些矩阵数据输入到                                          ME = ∑ ( y i - p i )        (4)
                                                                                     N
               ConvLSTM 进行模型的训练, ConvLSTM 通过不断                                         i = 1
                                                                 式中: N 代表样本数量; y i 是预测值; p i 是真实值。
               地学习降水数据的内在规律和特征, 逐步优化其预
                                                                 σ 和 Bias 越低表示预测效果越好。ME 的计算结果
               测能力, 进而来预测 2019 -2022年间每年夏季的降
                                                                 会存在正值与负值, 当它是正值时越低越好, 而当
               水量。本文主要关注中国西南地区每年夏季(5月 1
                                                                 它是负值时越高越好, 无论是正的还是负的, 均表
               日至 9 月 30 日)的降水量。在使用 ConvLSTM 时,
                                                                 示预测相对于真实值的倾向。正的平均误差表示
               让前一年夏季(5 个月)的降水量数据作为输入, 来
                                                                 模型倾向于高估实际值, 而负的平均误差表明模型
               预测下一年夏季(同样为 5个月)的降水量。为了提
                                                                 倾向于低估实际值。
               前更长时间尺度的预报, 在预测过程中, 该模型的
               输入不涉及仲秋到仲春的大气演变过程。                                3  结果分析
                   图 1(c)详 细 展 示 了 本 文 提 出 的 SST-ConvL‐
                                                                     在本文的研究中, 共计训练了两个模型, SST-
               STM 模型的训练和预测过程。该模型的核心改进
                                                                 ConvLSTM 和 ConvLSTM(详见第 2. 2 和 2. 3 节),
               在于创新性地将降水量数据与全球海表温度数据                             并利用西南地区及全球范围上一个夏季的降水量、
               相融合, 以此提升模型的预测性能。为适应 Conv‐                        海表温度数据, 以预测西南地区下一个夏季的降
               LSTM 模型的输入需求, 本文首先把海表温度数据                         水量。
               转化为矩阵形式。原始数据为全球日平均海表温                             3. 1 月均降水量预测
               度, 分辨率为 0. 25°×0. 25°。为确保降水量与海表                       经过分析发现, 如图 2(a)和 2(e)所示, 在 5
               温度数据在融合过程中能够保持恰当的权重, 本文                           月, 实况数据呈现逐年攀升的趋势, 而在 9 月, 则
               将原始数据的部分格点过滤, 得到全球分辨率为                            呈现逐年降低的趋势。如图2(b)~(d)所示, 降水量
               18°×8. 5°(纬度间隔 8. 5°, 经度间隔为 18°)的格点。              峰值一般集中在每年的 6 月和 7 月, 到了 8 月则整
               筛选后, 海温数据矩阵的维度也为 10行 9列。海温                        体逐渐下降。而在这三个月中, 随着年份的变化,
               数据矩阵中会包含陆地上的缺失值, 本文统一使用                           降水量呈现出一种先增加后降低的趋势。
               常数 1 代替, 该常数的取值不影响模型的训练和预                             而 NCC 的预测结果却表现得更加稳定, 如图 2
               测。随后, 本文将对应日期的海温和降雨数据矩阵                          (a)~(e)红色部分所示, 除了 2019 年 5 月和 2022 年
               拼接成一个大小为 10 行 18 列的矩阵, 并按照时间                      6 月的预测结果外, 基本上呈现一种先增加后降低
               顺序排列, 时间跨度为 1982 -2018 年间每年夏季                     的趋势。在图 2(a)和(e)中, 可以观察到 5 月份整
              (5 月 1 日至 9 月 30 日), 构成了新的训练集。这样,                  体出现了严重的高估, 而 9 月份整体出现了严重的
               海表温度数据可作为辅助信息提供了与降水量相                             低估。这可能归因于实况数据中某些地区发生了
               关的可预测性信息。在进行 2019 -2022 年间每年                      极端降水事件, 如图 2(d)中 2021年的异常降水, 导
               夏季的降水量预测时, SST-ConvLSTM 模型的输入                     致局部气候突变, 从而影响了 NCC 的预测效果。
               数据包括前一年夏季(5 个月)的海表温度与降水量                          模式预测在长期水平上受到多种因素的影响, 包括
                                                                 海洋、 陆地、 大气、 气溶胶和太阳辐射等。此外,
               结合数据, 进而输出下一年夏季(同样为 5 个月)的
                                                                 模式的长期预测水平也与地区和季节相关, 通常在
               预测数据。
                                                                 热带地区和冬季的降水预测方面表现较好, 而在中
               2. 4 评估方法
                                                                 高纬度地区和夏季的降水预测方面则相对较差
                   本文采用均方根误差(σ)、 绝对偏差(Bias)和
                                                                (White et al, 2017; 林倩等, 2019)。
               平均误差(ME)来评估降水量预测的准确性(Li et
                                                                     另一方面, 与实况数据相比, ConvLSTM 的预
               al, 2023)。计算公式为
                                                                 测结果同样呈现出一种相对平均且稳定的缓慢变
                                          1
                           é 1  N       2 ú ú )  ù ú ú  2  1  N  化趋势。这种趋势使得模型在准确预测较高或较
                           ê ê
                       σ = êê ∑( y i - p i    N ∑ p i    (2)
                            N
                           ë  i = 1      û      i = 1            低的降水量时面临一定的困难, 在预测较高降水量
   134   135   136   137   138   139   140   141   142   143   144