Page 373 - 《软件学报》2025年第8期

P. 373

3796 软件学报 2025 年第 36 卷第 8 期

v
u
t N ∑ M−1 p+q
1 ∑ ∑ ( ) 2
RMSE = x t+k,i − ˆx t+k,i (23)
MNq
i=1 t=0 k=p+1

N ∑ M−1 p+q
1 ∑ ∑ x t+k,i − ˆx t+k,i
MAPE = (24)
MNq x t+k,i
i=1 t=0 k=p+1
其中, x t+k,i 为真实的未来交通流, ˆ x t+k,i 为交通流的预测值, M 为时间样本, N 为节点数.
本文使用 1 h ( p = 12) 的历史观测时间来预测未来 30 min ( q = 6) 的交通流. 在实验中, 模型的时空特征提取
f pre (·) 分别由两个全连接层组成. 系数
模块 f g (·) 由两层堆叠的时空图卷积模块组成. 域判别器、流量预测模块
f w
λ 分别设定为 10 和 α 2 设置为 0.000 1, 以每 50 个训练步
γ 和 1. 域判别器的学习率 α 1 、流量预测模块的学习率
0.8 的速率衰减. 批大小设置为 64, 迭代次数为 500.
为验证 TL-STGCN 模型的性能, 选择以下基线方法进行对比.
● HA: 使用目标域的历史流量平均值进行预测.
● GRU [27] : 采用门控机制基于时间序列来捕获交通流的长期依赖性, 本文在目标域数据集上执行 GRU 模型来
预测交通流.
● GCN [28] : GCN 模型能够提取空间特征来进行预测, 本文在目标域数据集上执行 GCN 模型来预测交通流.
[8]
● STGCN : 将 GCN 和门控卷积结合, 联合提取时空特征. 本文只在目标域数据集上训练 STGCN 模型, 并对
目标域进行交通流预测.
● DastNet [13] : 结合图嵌入和 GRU, 在源域上学习节点的图嵌入, 并且将学习到的图嵌入迁移到目标域中, 辅助
目标域进行预测任务.
● MGAT [29] : 针对数据稀缺的交通路网, 结合 LSTM 和 CNN 与空间注意力机制, 对目标城市和源城市相似的
多粒度特征编码进行迁移, 自适应地将元知识应用于目标路网.
● S-only: 在源域数据集上执行本文中基于时间注意力机制的时空图卷积网络模型, 并在目标域测试集上直接
进行预测.
● TL-STGCN-noTA: 跟 TL-STGCN 相比, 消除本文的注意力机制, 利用在源域上学习到的特征, 在目标域数
据集上进行预测.

4.3 结果及分析
(1) 与基线方法对比
将本文提出的 TL-STGCN 和基线模型在目标域数据集上进行未来 30 min 的交通流测任务. 对于没有迁移学
习的预测模型 (HA、GRU、GCN、STGCN), 直接将目标域数据集用于训练和预测. 对于其他有迁移学习的模型,
本文通过迁移学习任务对其性能进行评价. TL-STGCN 模型与基线模型性能的评估 MAE、MAPE、RMSE 的结果
如表 4 所示. 其中“－”表示误差过大, 说明模型性能极差.
从表 4 中可得知, 就 4 个目标域数据集中的所有评价指标来看, 在未来多个时间步内, 对比现有的深度学习模
型, 本文提出的 TL-STGCN 模型在数据稀缺的交通路网预测任务中拥有更好的性能.
对于没有迁移学习的方法来说, 基于传统统计方法的 HA 模型性能最差, 这是因为其直接采用历史平均值来
进行预测, 没有考虑交通路网数据中存在的复杂关系. 基于深度学习的 GRU 方法虽然能提取交通流数据间的时间
关系, 但是忽略了其中的空间关系; GCN 的方法能提取交通流的空间特征, 但是没有对时间特征进行处理. STGCN
模型能够同时捕获交通数据的时空特征, 但是这种方法依赖于大量的历史观测数据来训练模型, 因此, 在数据稀缺
的交通路网中预测性能仍不佳.
对于结合了迁移学习的方法, DastNet 采用图嵌入和迁移学习的方式从源域获取知识, 利用到了源域丰富的知
识, 因此该方法性能相对较好. 但是仍低于 TL-STGCN, 这是因为 TL-STGCN 利用了时间注意力机制能够更好地
提取特征. MGAT 方法也结合了迁移学习的方法, 且采用了空间注意力机制, 但这种方法将采用普通卷积获取空

368 369 370 371 372 373 374 375 376 377 378