Page 204 - 《高原气象》2026年第2期
P. 204

高     原      气     象                                 45 卷
              504

















                                                     图3 CNN模型框架图
                                    Fig. 3 Architecture of the convolutional neural network (CNN) model
             度, 帮助不同通道之间进行信息交互整合, 并减小                                         MAE EC - MAE DL
                                                                         SS =                × 100%       (4)
             模型参数量。最后连接全连接层, 将高维特征映射                                               MAE EC
             到目标回归值上, 输出最终预测结果。模型输入与                                           ATF =  n r  × 100%         (5)
                                                                                      n
             输出均为相同尺寸[形状为(116, 116)]的格点场,
                                                                式中: y ̂ 、 y 分别为模型预报值和观测值; MAE 、
                                                                                                           EC
                                                                       i
             模型能够在每个格点上进行偏差校正, 以确保气温
                                                                MAE 分别代表 ECMWF 和模型的平均绝对误差;
                                                                    DL
             预报的准确性。
                                                                n 为|y ̂ - y i |≤2 ℃的样本数; n 为总样本数; ATF 是
                                                                 r
                                                                      i
                  训练集时间设定为 2018 年 1 月至 2022 年 3 月,
                                                                总样本中预测值与观测值之间的绝对差值不大于
             验证集时间为 2022 年 4 -6 月。在训练 CNN 模型
                                                                2 ℃的样本百分比。
             时, 本研究使用回归任务中通常采用的平均绝对误
             差(MAE)损失函数来寻找模型的最佳权重。由于                            4  结果与分析
             自适应矩估计(Adaptive Moment Estimation, AD‐
                                                                4. 1 不同特征组合方案对比
             AM)算法在训练过程中具有快速、 稳定的收敛性,
                                                                    为验证地理变量在模型性能中的影响, 本文设
             因此选择 ADAM 作为优化器。采用早停法机器学
                                                                计了不同的特征组合方案。采用控制变量法, 保持
             习训练策略, 当模型在验证集上连续 3 个时期损失
                                                                ECMWF 预报因子和临近观测因子不变, 分别利用
             值不降反增时, 停止训练, 以避免模型在训练集上
                                                                三种不同的方案建模: 方案一引入经过 K-means 处
             过拟合。模型训练超参数设置见表2。
                                                                理的地理变量聚类特征, 方案二引入标准化后但不
                          表2  模型训练超参数设置                         聚类的地理变量, 方案三不加入地理变量, 以此分
                   Table 2  Hyperparameter configurations for   离地理变量的独立贡献。通过构建地形参数相关
                               model training                   性矩阵评估变量间共线性特征, 发现高程-坡度、
                       超参数                    设置                高程-坡向、 坡度-坡向的皮尔逊相关系数分别为
                       学习率                    0. 001            0. 59(p<0. 01)、 0. 04(p<0. 05)和 0. 05(p<0. 05), 均
                     优化器算法                  ADAM算法              显著低于多重共线性警戒阈值 0. 7(Dormann et al,
                                                                2013)。这表明原始连续型地形参数虽存在一定的
                     训练时期数                     400
                                                                地形耦合效应, 但未达到显著共线性水平, 满足直
                     正则化方法                    早停法
                                                                接输入模型的统计独立性要求。
                       批量数                     64
                                                                    尽管地理变量间无显著信息冗余, 空间离散化
                      损失函数                    MAE
                                                                处理仍展现出重要建模价值。K-means算法将连续
             3. 3 检验方法                                          变量转化为离散的空间分区, 把具有相似地表特征
                  测试集时间为 2022年 7月至 2023年 6月, 为评                 的区域归并为一类, 使模型能更清晰地识别区域间
             估 ECMWF 和各模型在测试集上预报性能, 选用                          的差异性, 显著提升模型性能。在本研究中, 采取
             MAE、 技巧评分(SS)以及预报准确率(ATF)作为检                       的建模方式是根据不同预报时效单独建模, 为了减
             验指标, 公式如下:                                         小工作量, 特征组合方案试验基于 24 h预报时效的
                                   1  n      |                  CNN 模型进行。试验结果表明(图 4), 三种方案预
                                   n                            报结果相比 ECMWF 模式均降低了预报误差, 方案
                            MAE = ∑ | y ̂ - y i         (3)
                                         i
                                    i = 1
   199   200   201   202   203   204   205   206   207   208   209