Page 184 - 《软件学报》2024年第4期
P. 184
1762 软件学报 2024 年第 35 卷第 4 期
输出序列和解码器序列之间的相关性, 生成的未来序列输入全连接网络映射至指定维度, 最后输出指定未来
预测步长的预测序列=(X t+1 ,X t+2 ,…,X t+n )∈ N×n .
2.6 时空嵌入模块
MVSTGCN 利用时间局部卷积多头自注意力模块和空间多视角动态图卷积模块, 有效地获取路网中的节
点的时空动态特性, 但忽略了空间异质性和时间序列的顺序信息.
在空间上, 未来的交通状态不仅受到动态变化的交通条件影响, 同时受到底层道路网络静态特征的限制,
静态特征主要由节点的局部拓扑结构和相应的道路类型(如高速公路、城市公路、社区街道等)等空间特征决
定. 节点的静态特征一般不随时间变化, 但受到空间变化的影响, 产生了节点的空间异质性, 例如高速公路上
的车辆行驶速度往往比生活街道上车辆的行驶速度快得多. 因此, 捕捉节点的空间异质性能够有效提升交通
预测的准确性. 受到 ASTGNN 模型 [32] 的启发, 本文提出一种空间嵌入方法: 首先为每个节点分配一个额外的
嵌入向量, 从而得到初始空间位置嵌入矩阵; 然后应用图卷积层进行拉普拉斯平滑, 使得每个节点与邻居节
点具有相似的表示, 在反映图结构信息的同时构建异质空间结构, 最终得到空间嵌入矩阵 E SP .
在时间上, 交通流量数据的时间动态特性借助自注意力机制进行捕获, 自注意力模型以同时处理整个时
间序列, 无法考虑时间序列的顺序信息. 然而在交通流量预测任务中, 邻近的观测数据往往具有更强的相关
性, 例如预测晚高峰的交通流量, 相邻 1h 的交通状况相比于相邻 2h 的交通状况提供了更有用的信息,因此顺
序信息在时间序列建模中至关重要. 为了有效建模时间序列的顺序信息, 本文使用 Transformer 的时间嵌入方
法 [39] , 给初始序列每个元素都添加一个时间位置嵌入向量, 使得相邻元素具有相近的表征. 为位置 t 处的输入
元素选择固定位置嵌入, 得到时间嵌入矩阵 E TP 并且每个向量维度 1≤d≤d model 如下所示:
t
dd
E TP ( ,2 ) sin( /10000 2/ model ) (19)
t d =
E TP ( ,2t d + 1) = cos( /10000t 2/ model ) (20)
dd
其中, t 是输入中每个元素的相对索引. 将空间嵌入矩阵 E SP 和时间嵌入矩阵 E TP 添加至交通流量序列之中,
MVSTGCN 就得到了保留了节点空间异质性与时间序列顺序特征的交通流量序列:
SP+TP =+E TP +E SP (21)
3 实验分析
为了验证本文方法的有效性, 我们在 4 个真实的高速公路流量数据集和城市地铁人群流量数据集上进行
实验. 本节首先对数据集和实验设置进行介绍说明, 然后将本文方法与基于统计方法和深度学习方法的 11 种
方法进行对比分析, 最后进行消融实验与内部分析, 以验证本文方法中每个模块的有效性.
3.1 数据集
本文使用的高速公路流量数据集是由 Caltrans Performance Measurement System (PeMS) [40] 收集的美国加
利福尼亚州 4 个地区的真实高速公路流量数据, 分别是 PEMS03, PEMS04, PEMS07 和 PEMS08. PeMS 提供了
由加州运输公司在加州高速公路上实时采集的高速公路流量数据集, 以及其他公司及机构收集的统一交通数
据库. 道路的检测器每 30s 报告一次数据, 以 5min 为间隔进行聚合, 一天的交通数据流中包含 288 个数据点,
其中记录了传感器站的地理信息以及带时间戳的车流量、平均车速、平均车道占用率这 3 个维度的特征.
城市地铁人群流量数据集为杭州城市内地铁网络上的人群流量数据集, 该数据集使用 2019 年 1 月收集的
杭州地铁系统交易记录创建, 其中涉及 3 条线路 80 个运营站约 7 000 万条数据, 每天有 235 万乘客, 原始人
群流量数据被汇总为以 5min 为时间间隔的采样点, 每条记录包含流入人群量和流出人群量.
两种城市流量数据集展现出不同的时空特性, 高速公路流量数据集由高速公路上分布的检测器实时收
集, 节点之间具有较强的空间相关性; 而城市地铁人群流量数据集由杭州地铁系统交易记录创建, 仅包含了
人群的进出站信息, 因此节点之间的空间相关性较弱. 在具有不同时空特性的数据集上验证本文方法的预测
性能, 增加实验结果的代表性和泛化能力, 数据集详细信息见表 2.