Page 190 - 《软件学报》2024年第4期
P. 190
1768 软件学报 2024 年第 35 卷第 4 期
更深的编码器/解码器层可以学习更多的抽象特征, 提高模型的表达能力; 但过高的层数可能会导
致模型过拟合, 影响模型性能. 因此, 本文将编码器/解码器层数设置为[2,3,4,5,6], 以探究最优编码
器/解码器层数;
(3) 注意力头的数量 h: 注意力头数量作为模型中的重要参数, 直接决定了每个输入位置能够关注到输
入序列中的信息数量. 一般来说, 增加注意力头的数量可以提升模型的表达能力和表示能力, 但是
也会增加模型的计算复杂度和训练难度. 本文将注意力头的数量设置为[1,2,4,8,16], 以确定最佳的
注意力头数量;
(4) 两种图表示的融合比例τ: 空间结构图基于静态的空间结构构建, 代表了空间结构的邻近性和连通
性, 动态关联图基于动态的时序相似性构建, 能够表征节点间相似的城市功能特性以及交通模式的
动态影响. 为了探究空间结构图和动态关联图两种视图在提取不同区域之间的双视角时空关联时,
两种图表示不同的融合比例对模型预测性能的影响, 将两种图表示的融合比例τ取值设置为[0.2,0.3,
0.4,0.5,0.6,0.7,0.8], 探究最佳两种图表示融合比例;
(5) 全局表示的融合比例α: 为了探究全局空间适应性和局部动力学之间的相互作用, 将全局表示的融
合比例α取值设置为[0.2,0.3,0.4,0.5,0.6,0.7,0.8], 以确定全局表示的最佳融合比例.
图 12 MVSTGCN 超参数实验结果
从图中可以看出: 当模型维度为 32 时, 模型取得了最优预测效果; 当模型维数为 16 时, 模型维数过小,
无法捕捉足够的交通序列的特征信息, 导致模型效果较差. 一定程度上, 增加模型维数可以增强模型对于交
通序列特征的表达能力, 提升模型性能; 但过高的模型维数会导致过拟合, 从而影响模型性能.
当编码器/解码器层数量为 5 时, 模型性能最优. 从图中可以看出: 适当增加编码器/解码器层数, 模型性
能有所提升; 但当编码器/解码器层数量增加为 6 时, 模型性能下降. 这是由于适当增加编码器/解码器层数可
以增强模型对交通数据的抽象提取能力, 提高模型的表达能力, 同时提高模型的感知范围, 更好地捕捉交通
数据输入/输出之间的长期依赖关系; 但过深的编码器/解码器层数可能会导致梯度爆炸或消失, 影响模型最
终的训练效果.
逐渐增加注意力头数量可以提升模型性能, 当注意力头数量为 16 时, 模型取得最优性能. 这是由于增加