Page 275 - 《高原气象》2026年第2期
P. 275
2 期 张远康等:基于Transformer架构的X波段双偏振雷达回波衰减订正研究 575
气科学与技术全国重点实验室雷达观测团队研发的 3 XCORnet网络架构设计
算法, 对雷达基数据进行数据质量控制, 包括地物、
3. 1 Transformer架构
孤立杂波滤除(刘黎平等, 2007; 李丰等, 2012; 文
大模型底层 Transformer 架构的流行程度已超
浩等, 2017), 并根据相关系数(CC)值对 K 筛选质 越传统的卷积神经网络(CNN)和循环神经网络
DP
控, 将 CC 值小于 0. 9 的样本进行剔除, K 大于 (RNN)。与 CNN 和 RNN 不同, Transformer 摒弃了
DP
-1
6. 0 (°)∙km 的数据统一设置为6. 0 (°)∙km 。
-1
传统的递归结构, 整个网络完全由自注意力机制和
2. 3 构建训练数据集
前馈神经网络组成, 通过 Seq2Seq 的训练方式, 将
考虑到模型的通用性, 采用 min-max标准化方 输入序列和目标序列直接关联起来, 能够创造性地
法对雷达数据进行标准化, 将数据映射到[-1, 1] 解决更具挑战性的问题。该架构最早由 Vaswani et
区间, 即: al (2017)提出, 旨在处理序列到序列的任务。与传
X nor = 2 X raw - X max - 1 (1) 统的循环神经网络(RNN)不同, Transformer并不依
X max - X min
赖递归方式处理序列数据, 而是通过自注意力机制
式中: X nor 为标准化后的参量; X raw 表示偏振参量原
实现输入数据的并行处理。这一创新大大提高了
始观测值; X max 和 X min 分别为参量的最大和最小值, 计算效率, 同时优化了模型的性能。在处理时间序
其设置见表2。 列预测时, Transformer不仅能够精准捕捉复杂的依
表2 各参数标准化的最大、 最小值设置 赖关系, 还能有效应对长时间序列中的相关性问
Table2 Configuration of maximum and minimum 题, 并且在训练与推理速度上表现优异。正是这些
values for parameter normalization 优势, 使得 Transformer 逐渐成为时间序列预测领
域的首选模型。考虑到本研究中的每个数据样本
参数 X min X max
-20 dBZ 70 dBZ 可以视作时间序列, 因此, 本文借鉴 Transformer架
Z H
-2 dB 6 dB 构, 设计了一种专门针对 X 波段雷达衰减订正的网
Z DR
-1˚ km 6˚ km
K DP -1 -1 络模型。
3. 2 XCORnet网络架构
本文以 SAD 时空匹配的数据为真值, 分别计
本文所研究的问题是关于 X 波段雷达回波的
算 XPOL 每个距离库的衰减率 A 、 差分衰减率 A , 衰减订正问题, 所构建的网络模型最终输出一个节
DR
H
并作为标签数据, 以标签所在距离库之前 15 个库 点, 即 X 波段雷达的衰减率 A 或差分衰减率 A ,
DR
H
的 XPOL 的 K 作为模型的输入因子, 构建一个样 进而实现 X 波段雷达衰减订正。为此, 基于 Trans‐
DP
本, 沿 XPOL 径向逐库滑动, 形成多个样本, 构建 former 设计 X 波段雷达回波衰减订正框架 XCOR‐
X波段雷达衰减订正深度学习训练数据集。经质控 net(图1)。
后 Z 和 Z 样本总数分别为 2642624、 2605583 组, 该框架包括一个编码器, 一个解码器, 并通过
DR
H
随机挑选其中 80% 用于训练, 20% 用于测试, 训练 全连接层输出衰减率。编码器以 XPOL标签所在库
数据集中, 再随机挑选20%作为验证集。 之前 15 个库的 K 有效值作为输入, 首先通过双线
DP
图1 衰减订正深度学习网络架构
Fig. 1 The deep learning-based network for dual polarimetric radar attenuation correction

