Page 143 - 《高原气象》2025年第6期
P. 143
6 期 谭淇昌等:基于深度学习方法改进CMIP6模式对中国东部沿海复合极端风雨事件的模拟能力 1551
图2 神经网络图
Fig. 2 Neural network diagram
输出层。其中, 隐藏层包含多层线性层, 每层线性 低表明模型模拟效果越好, 根据 RSD 值越接近 1 表
层中有若干神经元, 神经元通过不同权重参数实现 示模拟结果与观测的数据分布情况更接近, 对 RSD
层间的信息传递, 同时每个神经元的输出经由 函数进行微调, 式(6)。此外, 以 MSE 作为损失函
Leaky ReLU(Rectified Linear Unit)激活函数进行变 数时发现, DL 模型模拟结果相对于观测结果存在
换。为了使得模型能够学习输入和输出的映射关 低估问题。为了解决这一问题, 本文构建低估值约
系, 采用梯度下降法和反向传播算法对模型参数进 束函数(Min_Loss), 式(7), 旨在模型训练过程中,
行训练和优化。 考虑对模拟低估值的调整, 以减少模拟偏差。
在数据集划分方面, 本研究根据Yan et al(2022) 为了确保模型训练过程中, 既考虑模型对数据
的基础上进行调整, 选取前40年(1961 -2000年)模 分布捕捉能力, 同时也解决模型低估模拟问题。在
式模拟结果和观测统计的 CWPE 频率数据作为训 整体损失值计算过程中, 将 RSD 和 Min_Loss 两个
练集。其中, 17个模式的模拟结果作为特征值输入 函数对应的权重系数比取为 1∶1, 视为相同重要性。
模型, 观测统计结果作为真实值, 用于约束 DL 模 基于 MSE 函数并结合 RSD 和 Min_Loss, 构建的加
型。通过多轮迭代训练, 最终构建 DL 模型(Ham 权损失函数计算公式为式(8):
et al, 2019)。随后, 利用剩余 14年(2001 -2014年) 1 N 2
N
i
的模式数据作为测试集, 输入到训练好的 DL 模型 MSE = ∑ ( y i - y ̂ ) (5)
i = 1
中, 得到模型模拟的数据集。 ( ) 2
在构建 DL 模型时发现, 使用常规的均方误差 RSD = σ y - 1 (6)
函数(Mean Squared Error, MSE), 式(5), 作为损 σ ̂ y
1 N
失 函 数 建 立 的 DL 模 型 对 中 国 东 部 沿 海 地 区 的 Min_Loss = ∑ max (0, y ̂ - y i ) (7)
i
CWPE 模拟效果不佳, 具体参考 4. 1 的结果。相关 N i = 1
式中: y i 表示模拟值; y ̂ 表示观测值; σ y 和 σ ̂ 分别表
研究表明, 通过调整损失函数的方式可以有效实现 i y
示模拟值和观测值的标准差。
对模型性能的调整(Lyu et al, 2023)。因此, 本文
Loss = W 1 × MSE + W 2 × RSD + W 3 × Min_Loss (8)
提出在 MSE 函数基础上结合标准差之比(Ratio of
the Standard Deviation, RSD)以及构建低估值约束 式中: W 1 、 W 2 和 W 3 分别表示各函数的权重参数,
函数(Min_Loss), 并采用加权组合的方式调整不同 总和为1。它们分别调节MSE、 RSD和Min_Loss在
函数在模型训练过程中的贡献, 从而优化模型的整 整体损失计算中的相对重要性。各权重参数的确
体性能。 定具体参考4. 2的结果。
RSD 常被用于气候模式评估中衡量模式与观 4 研究结果
测之间的数据分布差异, 通过在损失函数中引入
RSD, 旨在使模型更好地捕捉特征值与观测值之间 4. 1 CMIP6和深度学习模型对中国东部沿海CWPE
的数据分布, 从而提高模型模拟的准确性。由于本 模拟的评估
文 DL 模型的参数更新采用梯度下降法, 损失值越 图 3 为 17 个 CMIP6 模式及多模式集合方法

