Page 76 - 《高原气象》2026年第2期

P. 76

高原气象 45 卷
376
（Sentinel-3A/3B）对青海湖的水位变化的监测成果。
研究显示，不同高度计的数据在青海湖的监测结果
较为一致，融合后的水位数据均方根误差（Root
Mean Square Error， RMSE）为 0. 204 m，与地面观测
数据的相关系数为 0. 941 （Ma et al， 2024）。时间跨
度为1959年1月至2017年12月。
大气数据来源于高分辨率欧洲中期天气预报
中心第五代再分析数据集（ECMWF Reanalysis 5th
Generation， ERA5）。该数据集涵盖了从 1000 hPa
图2 1959 -2017年青海湖年平均水位过程线
Fig. 2 Annual mean water level process line of 到 50 hPa 之间的 20 个气压层，包含了一系列标准
Qinghai Lake from 1959 to 2017 大气变量。表 1概述了用于特征选择的大气变量和
地表变量（参见表 2的符号列表）。并选择美国国家
2. 2 数据来源
海洋和大气管理局（National Oceanic and Atmo‐
青海湖水位月均数据源自青海省水文气象部
spheric Administration， NOAA）气候预测中心下载
门的长期观测记录，并结合多种高度计冰云与陆地的 NAO、 AMO、太平洋 10 年涛动（Pacific Decadal
高程卫星（ICESat/-2）、冰雪卫星（CryoSat-2）、杰森 Oscillation， PDO）和尼诺 3. 4 区海表温度异常
系列海洋高度计卫星（Jason-1/2/3）及哨兵三号卫星（Niño 3. 4）气候指数作为额外的输入变量。

表1 再分析数据的大气和表面变量概述
Table 1 Overview of atmospheric and surface variables from reanalysis data
数据时间范围空间分辨率时间分辨率气压层大气变量地表变量
ERA5 1959 -2017年 0. 25°×0. 25° 1 h 50~1000 hPa RH， T， U， V， W Cloud， Precip， SLP， SW， t2m， td2m， LW

表2 再分析数据的大气和表面变量的符号列表位数并除以四分位间距（第 25~75个百分位数）的标
Table 2 Symbol list of atmospheric and surface 准化方法。该方法能有效保留数据的异常值信息
variables derived from reanalysis data
并降低其对整体数据分布的影响，生成的标准化数
符号变量名称符号变量名称据具有中位数为 0、标准差为 1 的特性。对于水位
Cloud 云量 SW 入射短波辐射数据，通过减去最小值并除以极差的方法，将输入
td2m 表面以上2 m处的露点温度 T 气温与目标数据统一缩放到 0~1 的区间内，有效提升模
LW 出射长波辐射 t2m 空气温度2 m以上型计算效率，并保持数据原始分布特征。
Precip 降水 U 东风 3. 2 模型构建
RH 相对湿度 V 北风
基准模型采用 MLR，其描述了因变量和自变
SLP 平均海平面气压 W 垂直风速
量之间的线性关系，并使用了与现有研究相同的
MLR算法（Kadam et al， 2019）。RF由多个回归树组
3 研究方法
成，通过集成方式实现非线性数据的预测，并可提
3. 1 数据处理供变量重要性排序（Pedregosa et al， 2012）。SVM通
为了合理划分数据集， 1959 -2001 年的数据用过核函数映射非线性关系，构建超平面优化模型的
于训练， 2002 -2006 年作为交叉验证集以防止过拟拟合效果（Cortes and Vapnik， 1995）。多层感知机
合，而 2007 -2017 年则用于测试。首先使用 RF 算（Multi-layer perceptron， MLP）作为一种前馈神经网
法进行特征选择，确定适用于所有机器学习和基准络，通过多层结构与激活函数捕捉复杂非线性关
模型的统一输入变量。通过对数据的特征筛选，提系，权重通过反向传播算法优化（Singh et al， 2012；
取了前 50 个对水位变化具有重要性的特征，按数 Ghorbani et al， 2018）。LSTM 专门用于处理时间序
量划分为五组特征子集（分别为前 10、 20、 30、 40、列数据，利用遗忘门、输入门和输出门能有效捕捉
50个特征），用于模型性能的逐级比较分析。长期依赖关系，数据输入结构需调整为三维格式以
在数据预处理中，针对大气数据采用了去除中适应模型需求（Hochreiter and Schmidhuber， 1997）。

71 72 73 74 75 76 77 78 79 80 81