Page 189 - 《软件学报》2024年第4期

P. 189

赵文竹等: 多视角融合的时空动态 GCN 城市交通流量预测 1767

图 11 MVSTGCN 消融实验结果

动态关联图构建模块对于整体模型的性能提升至关重要, 去除动态关联图构建模块的模型无法捕捉节点
之间相似的功能特性与动态交通模式的影响, 单一视角建模空间相关性, 导致性能显著降低. 同时, 使用传统
图卷积模块替换动态图卷积模块也会导致模型性能降低. 这是由于动态图卷积模块可以动态调整空间相关性
强度, 有效捕捉交通路网中的空间动态特性, w/o DGCN 的性能下降表明了动态图卷积模块的必要性.
去除局部卷积注意力机制的 MVSTGCN 模型性能下降, 表明在时间序列建模中学习序列局部上下文信息
的重要性, 使用局部卷积注意力机制比传统的多头自注意力机制具有更好的预测性能. MVSTGCN 性能优于
w/o Glo, 证明了全局空间相关性对预测性能的显著影响, 忽略全局空间相关性只关注节点局部之间的依赖关
系, 会导致预测性能的下降.
去除空间位置和时间位置嵌入的 w/o Emb 相较于 MVSTGCN 性能显著降低, 表明使用空间位置嵌入考虑
静态空间特征和利用时间位置嵌入捕捉时间序列顺序信息对于模型的重要性, 嵌入模块有效捕获了交通数据
的空间异质性和时间序列的相关性.
当模型缺少残差连接和层归一化时, 模型性能有所下降, 表明配备残差连接和层归一化的模型可以解决
深层网络训练过程中梯度消失和梯度爆炸问题, 帮助模型更好地捕捉交通数据中的序列特征, 从而提升模型
的精度和稳定性. 同时, 残差连接和层归一化可以帮助模型加速网络的收敛速度, 提高模型的泛化性能, 更好
地处理输入数据的噪声和异常值, 从而提升模型的鲁棒性和准确性.
3.6 网络超参数设置的影响
为了进一步研究网络超参数设置的影响, 我们设置了不同的网络核心超参数, 在 PEMS08 数据集上进行
了实验. 选择的超参数如下: 模型维度 d、编码器/解码器层的数量 L、注意力头的数量 h、两种图表示的融合
比例τ、全局表示的融合比例α, 具体的实验结果如图 12 所示.
(1) 模型维度 d: 在模型训练过程中, 模型维度会对模型的性能和效果产生较大的影响. 一般来说, 模型
维度越大, 模型对于数据的特征表达能力越强, 可以更好地提取序列复杂的特征信息; 但模型维度
过大会导致训练过拟合, 模型泛化能力下降. 同时, 若模型维度过小, 则模型无法捕捉足够的特征
信息导致欠拟合. 为了寻找最佳模型维度, 本文将模型维度设置为[16,32,64,128];
(2) 编码器/解码器层的数量 L: 编码器/解码器层数量的选择, 对于模型训练效果同样重要. 一般来说,

184 185 186 187 188 189 190 191 192 193 194