Page 176 - 《软件学报》2024年第4期
P. 176
1754 软件学报 2024 年第 35 卷第 4 期
全局特征来表示城市整体的时空特性, 捕获局部空间结构和全局空间特征的时空依赖; 最后, 利用上下文感
知的局部卷积多头自注意力机制捕获交通流量的时间相关性, 并通过解码模块预测城市未来交通流量状态.
本文的主要贡献如下:
(1) 提出了一种多视角融合的时空动态图卷积交通流量预测模型 MVSTGCN, 从静态路网和动态模式视
角出发, 分别构建空间结构图和动态关联图, 并设计动态图卷积网络学习路网节点在空间结构图和
动态关联图两种结构下的空间依赖特征, 捕捉路网中的空间结构特性;
(2) MVSTGCN 从局部视角和全局视角出发, 设计路网的全局时空特征学习模块, 利用全局特征提取路
网全局空间相关性, 获得长期时空依赖关系, 挖掘交通网络中全局空间相关性和局部动态之间的相
互作用, 提高了交通流量的预测性能, 实现了有效的长期交通流量预测能力;
(3) 选择了 11 种对比模型, 其中 4 种非图卷积模型, 7 种图卷积模型, 并在 4 个真实的交通数据集上对
MVSTGCN 的有效性进行实验验证. 本文模型在 4 种数据集上的预测结果与最优图卷积模型相比,
均有 4.8~14.8%的提升, 证明了 MVSTGCN 在交通流量预测中的有效性.
本文第 1 节介绍交通预测和图卷积网络的相关工作. 第 2 节提出多视角融合的时空动态图卷积网络框架.
第 3 节通过对比实验验证所提模型的有效性和可解释性. 第 4 节总结全文并提出展望.
1 相关工作
近年来, 交通流量预测的研究受到广泛关注并取得了一定进展. 现有的交通流量预测从技术的角度主要
可以分为以下 3 种: 基于浅层模型的流量预测方法、基于卷积神经网络的流量预测方法以及基于图神经网络
的流量预测方法.
1.1 基于浅层模型的交通流量预测
浅层模型的预测方法大致分为基于统计的方法与基于传统机器学习的方法. 基于统计的方法是通过建立
统计模型, 对数据进行预测和分析. 早期具有代表性的方法包括历史平均法(historical average, HA) [15] 、自回归
综合移动平均法(auto-regressive integrated moving average, ARIMA) [16] 、卡尔曼滤波法 [17] 等. HA 以历史一段时
间交通数据的均值为依据, 模拟未来交通趋势. ARIMA 及其扩展方法是要求时间序列达到弱平稳, 然后使用
数学模型拟合历史数据来预测时间序列中的未来点. 卡尔曼滤波法是根据现有数据形成对下一个观测值的最
佳预测模型. 基于统计的方法框架简单, 计算方便, 但需假设交通静止, 且无法处理非线性数据, 面对如今数
据量大、复杂且非线性的交通流量数据, 其处理能力不足 [18] .
由于基于统计模型的诸多不足, 许多传统机器学习方法被应用于交通流量预测领域, 例如 K 最近邻模型
(K-nearest neighbor, KNN) [19] 、支持向量回归(support vector regression, SVR) [20] 等. KNN 是一种简单、直观、易
于实现且应用范围广的监督非参数机器学习算法, 通过搜索与当前变量值匹配的 K 个最近邻, 并使用该 K 个
数据来预测下一个周期的值. SVR 建立一个超平面作为给定训练样本的决策面, 使所有样本点都接近超平面,
并使样本点与超平面的总偏差最小. 基于结构风险最小化原理的 SVR 与其他非线性预测模型相比, 避免了容
易陷入局部最优的缺点. 基于传统机器学习的交通流量预测方法相较于基于数理统计的方法具有更高的预测
精度, 建模时对不同交通模式之间关系的先验知识需求较少, 无需对预测任务添加过多限制, 但需人工提取
特征, 严重依赖特征工程, 同时, 无法很好地建模交通数据间复杂的时空相关性 [21] .
1.2 基于卷积神经网络的交通流量预测
深度学习作为机器学习的子领域, 由于其在计算机视觉 [22] 、自然语言处理 [23] 等领域中表现出强大的特征
提取能力, 让深度神经网络逐渐被应用至交通流量预测之中. 其中, 多种基于卷积神经网络的流量预测方法
被提出以捕捉交通数据的空间相关性. 早期的深度学习方法将道路网络或整个城市划分为规则网格, 构建不
同区域间的欧式关系, 预测网格内的交通流量, 并使用卷积神经网络提取空间特征. 如: Zhang 等人 [24] 利用带
有残差结构的 CNN 网络, 分别动态聚合时间邻近性、周期性、趋势性这 3 个时间特性, 并将 3 个 CNN 的输