Page 206 - 《武汉大学学报(信息科学版)》2025年第6期
P. 206
1228 武 汉 大 学 学 报 (信 息 科 学 版) 2025 年 6 月
状态进行更新;遗忘门的主要功能是调节特定输 融入模型,使得模型在预测积水深度时,同时考
入单元存储器的信息遗忘速率,以一定的概率来 虑时间特征和空间特征,为积水深度预测提供更
决定是否保留前一层的隐藏状态;输出门则负责 全面的依据,提高预测准确性。将多项式计算结
管理单元存储器的输出,其核心任务是确定下一 果与特征融合模块得到的时间卷积结果进行矩
个 隐 藏 状 态 的 值 ,并 可 用 于 后 续 的 预 测 。 在 阵乘法计算。然后,将矩阵乘法的结果与原始输
LSTM 中,早期时间步的信息传递至后续时间步 入特征 X 输入至残差模块,残差模块通过跳跃连
的单元,有效缓解了长期依赖性问题 [14] 。 接构成特殊结构,有效地缓解梯度消失与梯度爆
利用积水时序特征提取模块提取特征矩阵 X 炸的问题,确保梯度能在反向传播中正常传递。
的时序特征,该模块的输入维度为 T,隐藏层维度 最后,通过 ReLU 激活函数进行非线性处理。常
为 T,网络层数为 2。将 X 输入特征提取模块得到 用 的 激 活 函 数 主 要 有 Sigmoid [15] 、Tanh [16] 和 Re‑
T temperal,其维度为 B×N×(T×F),其中时间步长 LU [17] ,本文采用 ReLU 激活函数提高训练效率。
T 与特征 F 被展平为单一维度,为了在张量中重 通过这些操作输出最终结果。
新组织数据,将 T temperal 维度重构成 B×N×T×F。 模型构建流程如图 2 所示。
1.2.4 积水深度空间特征提取模块
积水深度空间特征提取模块通过 5 个可学习
的权重矩阵 W 1 ~W 5 生成节点的注意力系数,帮
助模型在空间上对不同监测站赋予不同的重要
性权重,从而更好地捕捉空间特征。计算式为:
S spatial = Softmax(W 5 ⋅
T
σ ((T temperalW 1W 2 )(W 3 T temperal ) + W 4 ) ) (3)
式中, W 1 为一维权重向量,用于表示每个节点的
偏置项,输入张量 T temperal 先与时间步长权重 W 1 相
乘,这是一个时间维度的加权操作,在计算中为
每个节点赋予不同的重要性; W 2 是一个二维权
重矩阵,将 T temperal 与时间步长权重 W 1 相乘得到的
结果与 W 2 相乘,用于将输入特征映射到每个节
点上,实现特征空间到节点空间的转换; W 3 是一
个一维权重矩阵,T temperal 与 W 3 相乘,用于表示输
入特征每个通道的权重,帮助模型在特征层面进
行选择和调整; W 4 是一个三维权重矩阵,用于表
示时间步之间的相似度,有助于模型捕捉时间序
列数据中的时序特性; W 5 是一个二维权重矩阵,
用于表示时间步之间的相互影响,有助于模型理
图 2 ChebNet-LSTM 模型结构图
解 时 间 序 列 数 据 的 动 态 变 化 ;σ 表 示 激 活 函 数 ;
Fig. 2 Architecture of ChebNet-LSTM Model
Softmax 表示归一化函数;输出结果为 S spatial,维度
大小为 B×N×N。 1.2.6 参数设置
1.2.5 积水深度特征融合模块 在进行模型训练时,通过计算损失和反向传
首先,将重构后的 T temperal 输入至积水深度空 播算法进行参数调优,获得最优的积水深度预测
间 特 征 提 取 模 块 ,并 将 其 维 度 重 构 为 B×(F× 模型。反向传播的核心在于将误差从输出层逐
T)×N,并与 S spatial 输入到积水深度特征融合模块 层向输入层反向传播,并根据链式法则计算每个
中,积水深度特征融合模块输出数据维度为 B× 参数的梯度。
N×T×F;根据节点关系矩阵 A' 计算拉普拉斯矩 在模型性能评估的指标体系中,损失函数占
阵和二阶切比雪夫多项式,计算拉普拉斯矩阵和 据着关键地位,它能精准量化模型预测结果相较
二阶切比雪夫多项式得到的空间特征信息是时 于实际数值的偏离程度,为衡量模型表现优劣提
空特征融合的关键部分。通过将空间结构信息 供 不 可 或 缺 的 量 化 依 据 。 由 于 均 方 差(mean