Page 204 - 《高原气象》2026年第2期
P. 204
高 原 气 象 45 卷
504
图3 CNN模型框架图
Fig. 3 Architecture of the convolutional neural network (CNN) model
度, 帮助不同通道之间进行信息交互整合, 并减小 MAE EC - MAE DL
SS = × 100% (4)
模型参数量。最后连接全连接层, 将高维特征映射 MAE EC
到目标回归值上, 输出最终预测结果。模型输入与 ATF = n r × 100% (5)
n
输出均为相同尺寸[形状为(116, 116)]的格点场,
式中: y ̂ 、 y 分别为模型预报值和观测值; MAE 、
EC
i
模型能够在每个格点上进行偏差校正, 以确保气温
MAE 分别代表 ECMWF 和模型的平均绝对误差;
DL
预报的准确性。
n 为|y ̂ - y i |≤2 ℃的样本数; n 为总样本数; ATF 是
r
i
训练集时间设定为 2018 年 1 月至 2022 年 3 月,
总样本中预测值与观测值之间的绝对差值不大于
验证集时间为 2022 年 4 -6 月。在训练 CNN 模型
2 ℃的样本百分比。
时, 本研究使用回归任务中通常采用的平均绝对误
差(MAE)损失函数来寻找模型的最佳权重。由于 4 结果与分析
自适应矩估计(Adaptive Moment Estimation, AD‐
4. 1 不同特征组合方案对比
AM)算法在训练过程中具有快速、 稳定的收敛性,
为验证地理变量在模型性能中的影响, 本文设
因此选择 ADAM 作为优化器。采用早停法机器学
计了不同的特征组合方案。采用控制变量法, 保持
习训练策略, 当模型在验证集上连续 3 个时期损失
ECMWF 预报因子和临近观测因子不变, 分别利用
值不降反增时, 停止训练, 以避免模型在训练集上
三种不同的方案建模: 方案一引入经过 K-means 处
过拟合。模型训练超参数设置见表2。
理的地理变量聚类特征, 方案二引入标准化后但不
表2 模型训练超参数设置 聚类的地理变量, 方案三不加入地理变量, 以此分
Table 2 Hyperparameter configurations for 离地理变量的独立贡献。通过构建地形参数相关
model training 性矩阵评估变量间共线性特征, 发现高程-坡度、
超参数 设置 高程-坡向、 坡度-坡向的皮尔逊相关系数分别为
学习率 0. 001 0. 59(p<0. 01)、 0. 04(p<0. 05)和 0. 05(p<0. 05), 均
优化器算法 ADAM算法 显著低于多重共线性警戒阈值 0. 7(Dormann et al,
2013)。这表明原始连续型地形参数虽存在一定的
训练时期数 400
地形耦合效应, 但未达到显著共线性水平, 满足直
正则化方法 早停法
接输入模型的统计独立性要求。
批量数 64
尽管地理变量间无显著信息冗余, 空间离散化
损失函数 MAE
处理仍展现出重要建模价值。K-means算法将连续
3. 3 检验方法 变量转化为离散的空间分区, 把具有相似地表特征
测试集时间为 2022年 7月至 2023年 6月, 为评 的区域归并为一类, 使模型能更清晰地识别区域间
估 ECMWF 和各模型在测试集上预报性能, 选用 的差异性, 显著提升模型性能。在本研究中, 采取
MAE、 技巧评分(SS)以及预报准确率(ATF)作为检 的建模方式是根据不同预报时效单独建模, 为了减
验指标, 公式如下: 小工作量, 特征组合方案试验基于 24 h预报时效的
1 n | CNN 模型进行。试验结果表明(图 4), 三种方案预
n 报结果相比 ECMWF 模式均降低了预报误差, 方案
MAE = ∑ | y ̂ - y i (3)
i
i = 1

