Page 366 - 《软件学报》2025年第8期
P. 366

李云 等: 面向数据稀缺场景的智能交通流量预测                                                         3789


                 以及平均绝对百分比误差这          3  种指标对模型进行评估. 实验结果表明在这             3  种指标上, TL-STGCN  的精度均高于
                 基线方法, 验证了本文的       TL-STGCN  的预测效果优于基线模型.
                    本文第   1  节介绍相关工作. 第     2  节介绍本文的问题定义. 第       3  节介绍本文提出的     TL-STGCN  模型. 第  4  节通
                 过对比实验验证了所提模型的有效性. 最后总结全文和展望下一步工作.

                 1   相关工作

                 1.1   交通流预测

                    早期的交通流预测算法主要基于统计方法或者机器学习, 如历史平均模型                         (history average, HA)、自回归积分
                 滑动平均模型     (autoregressive integrated moving average model, ARIMA) 等, 但是这些模型很难提取交通路网中高
                 度非线性的时空特征, 且在大规模数据上表现较差. 随着深度学习的快速发展, 一些研究采用 RNN 来提取交通流
                 数据的时间相关性. Mou      等人  [14] 提出一种基于长短期记忆网络        (long short-term memory, LSTM) 的模型用于预测
                 单个路段的交通流, 该模型利用          LSTM  捕捉交通流数据在时间上的相关性. Poonia 等人          [15] 采用  LSTM  设计更深层
                 次的网络模型, 用以学习交通流数据的时间依赖关系及非线性特征, 从而预测瞬时交通流. Zhang                          等人  [16] 考虑天气
                 条件, 将天气特征和交通数据结合, 提出一种基于门控循环单元                   (gated recurrent unit, GRU) 的循环神经网络模型,
                 GRU  作为模型隐藏层中的神经元, 以提取数据在时间上的相关性. 然而交通流数据还具有空间相关性, 因此越来
                 越多的研究结合      RNN  和  CNN  等深度学习方法对交通数据进行研究, 旨在建立复杂的时空数据模型, 从而捕获交
                 通路网的时空依赖关系. Ma 等人         [17] 把交通路网的时空信息转化为二维时空矩阵, 将该矩阵作为描述交通流时空
                 关系的图像, 利用     CNN 提取该图像中的时空特征. Cheng         等人  [3] 提出了一种端到端的框架, 结合注意力机制调整
                 时空信息, 用   CNN  来获取交通路网的空间相关性, RNN          用来提取时间相关性. Zhuang      等人  [4] 将经过预处理的数据
                 作为  CNN  模型的输入以提取交通流的空间特征, 空间特征作为                 LSTM  模型的输入, 再提取时间上的特征. 结合
                 RNN  和  CNN  的方法能够同时捕捉交通流的时间特征和空间特征, 这些方法适用于标准的网格化数据. 然而现实
                 中的交通流数据都基于路网, 路网本质上是更为复杂的非欧氏图结构                      [18] , CNN  无法处理这种结构.
                    为了解决    CNN  对复杂的图数据特征提取不足的问题, 图卷积网络                 (graph convolutional network, GCN) [19]  被
                 提出, 由于  GCN  与交通路网的图结构高度契合, 因此被广泛应用于交通预测任务中. Guo 等人 基于                       GCN  和  GRU,
                                                                                         [5]
                 提出一种时空神经网络模型用于交通预测, 将交通数据表示为图形, 道路为边, 十字路口为节点, 使用 GCN                                和
                 GRU  来提取时空特征. Cui 等人     [6] 提出了一个交通图卷积算子以适应交通路网的物理特性, 并提取综合特征, 设
                 计一种基于    GCN  和  LSTM  的深度学习框架, 以学习空间和时间特征. 冯宁等人              [7] 将空间维度图卷积、时间维度
                 卷积和全连接层构成一个组件以捕捉数据的时空相关性, 通过                     3  个相同的组件分别建模交通流数据的近期、日
                 周期、周周期特性, 从而对交通流进行预测. Yu              等人  [8] 提出了时空图卷积网络, 该模型堆叠多个时空块, 每个时
                 空块串联一维卷积和        GCN  层, 利用  GCN  获取交通数据的空间相关性, 门控卷积用来提取交通数据的时间相关
                 性. Zhao  等人  [20] 提出基于时间图卷积网络交通流预测算法, GCN            用于学习复杂的拓扑结构捕获空间依赖性,
                 GRU  用于捕获时间依赖性.
                    注意力机制在深度学习中得到了广泛应用, 注意力机制旨在忽略不重要的信息, 对关键信息给予更多关注. 一
                 些研究结合了注意力机制, 从而得到更准确的时空特征. Zhang                等人  [21] 提出了注意力图卷积序列模型, 利用图卷积
                 运算捕获交通流数据的空间特征, 采用注意力机制为每个时间步长添加注意力向量以捕捉信息间的时间相关性.
                 Guo  等人  [22] 提出一种基于注意力的时空图卷积网络来解决交通预测问题, 该模型对交通流的临近、每日和每周的
                 依赖关系建模, 采用时空注意机制有效地捕捉交通数据中的动态时空关联, 用                         GCN 提取数据在空间上的相关性,
                 用标准卷积提取时间上的相关性. 赵文竹等人              [23] 结合局部卷积多头注意力机制来获取时间相关性, 使用动态图卷
                 积学习节点在静态空间拓扑和动态流量模式下的空间特性, 从而进行交通流预测.

                 1.2   迁移学习
                    迁移学习旨在从数据充足的源域中学习可迁移的知识, 以辅助数据稀缺的目标域完成预测任务, 是解决数据
   361   362   363   364   365   366   367   368   369   370   371