Page 206 - 《武汉大学学报(信息科学版)》2025年第6期
P. 206

1228                            武 汉 大 学 学 报  (信 息 科 学 版)                        2025 年 6 月

                状态进行更新;遗忘门的主要功能是调节特定输                            融入模型,使得模型在预测积水深度时,同时考
                入单元存储器的信息遗忘速率,以一定的概率来                            虑时间特征和空间特征,为积水深度预测提供更
                决定是否保留前一层的隐藏状态;输出门则负责                            全面的依据,提高预测准确性。将多项式计算结
                管理单元存储器的输出,其核心任务是确定下一                            果与特征融合模块得到的时间卷积结果进行矩
                个 隐 藏 状 态 的 值 ,并 可 用 于 后 续 的 预 测 。 在             阵乘法计算。然后,将矩阵乘法的结果与原始输
                LSTM 中,早期时间步的信息传递至后续时间步                          入特征 X 输入至残差模块,残差模块通过跳跃连
                的单元,有效缓解了长期依赖性问题                 [14] 。          接构成特殊结构,有效地缓解梯度消失与梯度爆
                     利用积水时序特征提取模块提取特征矩阵 X                        炸的问题,确保梯度能在反向传播中正常传递。
                的时序特征,该模块的输入维度为 T,隐藏层维度                          最后,通过 ReLU 激活函数进行非线性处理。常
                为 T,网络层数为 2。将 X 输入特征提取模块得到                       用 的 激 活 函 数 主 要 有 Sigmoid  [15] 、Tanh [16] 和 Re‑
                T temperal,其维度为 B×N×(T×F),其中时间步长                 LU [17] ,本文采用 ReLU 激活函数提高训练效率。
                T 与特征 F 被展平为单一维度,为了在张量中重                         通过这些操作输出最终结果。
                新组织数据,将 T temperal 维度重构成 B×N×T×F。                    模型构建流程如图 2 所示。
                1.2.4 积水深度空间特征提取模块
                     积水深度空间特征提取模块通过 5 个可学习
                的权重矩阵 W 1 ~W 5 生成节点的注意力系数,帮
                助模型在空间上对不同监测站赋予不同的重要
                性权重,从而更好地捕捉空间特征。计算式为:
                             S spatial = Softmax(W 5 ⋅
                                               T
                      σ ((T temperalW 1W 2 )(W 3 T temperal ) + W 4 ) ) (3)
                式中, W 1 为一维权重向量,用于表示每个节点的
                偏置项,输入张量 T temperal 先与时间步长权重 W 1 相
                乘,这是一个时间维度的加权操作,在计算中为
                每个节点赋予不同的重要性; W 2 是一个二维权
                重矩阵,将 T temperal 与时间步长权重 W 1 相乘得到的
                结果与 W 2 相乘,用于将输入特征映射到每个节
                点上,实现特征空间到节点空间的转换; W 3 是一
                个一维权重矩阵,T temperal 与 W 3 相乘,用于表示输
                入特征每个通道的权重,帮助模型在特征层面进
                行选择和调整; W 4 是一个三维权重矩阵,用于表
                示时间步之间的相似度,有助于模型捕捉时间序
                列数据中的时序特性; W 5 是一个二维权重矩阵,
                用于表示时间步之间的相互影响,有助于模型理
                                                                         图 2 ChebNet-LSTM 模型结构图
                解 时 间 序 列 数 据 的 动 态 变 化 ;σ 表 示 激 活 函 数 ;
                                                                     Fig.  2 Architecture of ChebNet-LSTM Model
                Softmax 表示归一化函数;输出结果为 S spatial,维度
                大小为 B×N×N。                                       1.2.6 参数设置
                1.2.5 积水深度特征融合模块                                     在进行模型训练时,通过计算损失和反向传
                     首先,将重构后的 T temperal 输入至积水深度空                播算法进行参数调优,获得最优的积水深度预测
                间 特 征 提 取 模 块 ,并 将 其 维 度 重 构 为 B×(F×             模型。反向传播的核心在于将误差从输出层逐
                T)×N,并与 S spatial 输入到积水深度特征融合模块                  层向输入层反向传播,并根据链式法则计算每个
                中,积水深度特征融合模块输出数据维度为 B×                           参数的梯度。
                N×T×F;根据节点关系矩阵 A' 计算拉普拉斯矩                            在模型性能评估的指标体系中,损失函数占
                阵和二阶切比雪夫多项式,计算拉普拉斯矩阵和                            据着关键地位,它能精准量化模型预测结果相较
                二阶切比雪夫多项式得到的空间特征信息是时                             于实际数值的偏离程度,为衡量模型表现优劣提
                空特征融合的关键部分。通过将空间结构信息                             供 不 可 或 缺 的 量 化 依 据 。 由 于 均 方 差(mean
   201   202   203   204   205   206   207   208   209   210   211