Page 204 - 《高原气象》2026年第2期

P. 204

高原气象 45 卷
504

图3 CNN模型框架图
Fig. 3 Architecture of the convolutional neural network （CNN） model
度，帮助不同通道之间进行信息交互整合，并减小 MAE EC - MAE DL
SS = × 100% （4）
模型参数量。最后连接全连接层，将高维特征映射 MAE EC
到目标回归值上，输出最终预测结果。模型输入与 ATF = n r × 100% （5）
n
输出均为相同尺寸［形状为（116， 116）］的格点场，
式中： y ̂ 、 y 分别为模型预报值和观测值； MAE 、
EC
i
模型能够在每个格点上进行偏差校正，以确保气温
MAE 分别代表 ECMWF 和模型的平均绝对误差；
DL
预报的准确性。
n 为|y ̂ - y i |≤2 ℃的样本数； n 为总样本数； ATF 是
r
i
训练集时间设定为 2018 年 1 月至 2022 年 3 月，
总样本中预测值与观测值之间的绝对差值不大于
验证集时间为 2022 年 4 -6 月。在训练 CNN 模型
2 ℃的样本百分比。
时，本研究使用回归任务中通常采用的平均绝对误
差（MAE）损失函数来寻找模型的最佳权重。由于 4 结果与分析
自适应矩估计（Adaptive Moment Estimation， AD‐
4. 1 不同特征组合方案对比
AM）算法在训练过程中具有快速、稳定的收敛性，
为验证地理变量在模型性能中的影响，本文设
因此选择 ADAM 作为优化器。采用早停法机器学
计了不同的特征组合方案。采用控制变量法，保持
习训练策略，当模型在验证集上连续 3 个时期损失
ECMWF 预报因子和临近观测因子不变，分别利用
值不降反增时，停止训练，以避免模型在训练集上
三种不同的方案建模：方案一引入经过 K-means 处
过拟合。模型训练超参数设置见表2。
理的地理变量聚类特征，方案二引入标准化后但不
表2 模型训练超参数设置聚类的地理变量，方案三不加入地理变量，以此分
Table 2 Hyperparameter configurations for 离地理变量的独立贡献。通过构建地形参数相关
model training 性矩阵评估变量间共线性特征，发现高程-坡度、
超参数设置高程-坡向、坡度-坡向的皮尔逊相关系数分别为
学习率 0. 001 0. 59（p<0. 01）、 0. 04（p<0. 05）和 0. 05（p<0. 05），均
优化器算法 ADAM算法显著低于多重共线性警戒阈值 0. 7（Dormann et al，
2013）。这表明原始连续型地形参数虽存在一定的
训练时期数 400
地形耦合效应，但未达到显著共线性水平，满足直
正则化方法早停法
接输入模型的统计独立性要求。
批量数 64
尽管地理变量间无显著信息冗余，空间离散化
损失函数 MAE
处理仍展现出重要建模价值。K-means算法将连续
3. 3 检验方法变量转化为离散的空间分区，把具有相似地表特征
测试集时间为 2022年 7月至 2023年 6月，为评的区域归并为一类，使模型能更清晰地识别区域间
估 ECMWF 和各模型在测试集上预报性能，选用的差异性，显著提升模型性能。在本研究中，采取
MAE、技巧评分（SS）以及预报准确率（ATF）作为检的建模方式是根据不同预报时效单独建模，为了减
验指标，公式如下：小工作量，特征组合方案试验基于 24 h预报时效的
1 n | CNN 模型进行。试验结果表明（图 4），三种方案预
n 报结果相比 ECMWF 模式均降低了预报误差，方案
MAE = ∑ | y ̂ - y i （3）
i
i = 1

199 200 201 202 203 204 205 206 207 208 209