Page 369 - 《软件学报》2025年第8期
P. 369

3792                                                       软件学报  2025  年第  36  卷第  8  期


                 3   TL-STGCN  模型

                 3.1   总体框架

                    本文提出的     TL-STGCN  模型主要由时空卷积网络、域判别器模块和交通流预测模块构成, 其总体框架如图                          2
                 所示.


                                       时间注意力          时序卷积层         图卷积层        时序卷积层




                                                                 源域                         源域
                                                                特征表示         交通预测          预测损失
                           时空图卷积               时空图卷积
                                       参数
                                       共享                                                  目标域
                                                                                           预测损失
                           时空图卷积               时空图卷积
                                                                目标域
                                                                特征表示         域判别器         域判别损失


                            源域数据               目标域数据
                                                  图 2 TL-STGCN  模型框架

                    首先, 将源域和目标域的历史观测数据作为输入, 分别送入到时空图卷积网络中以学习交通流数据的时空特
                 征表示. 该网络先采用时间注意力机制计算出不同时间序列间的相关性, 以自适应赋予数据相应的权重. 接着将经
                 过注意力机制调整后的数据输入到            Gated CNN  和  GCN  中提取源域和目标域的时空特征表示.
                    然后, 将学习到的特征表示发送到域判别器中. 域判别器用来度量源域和目标域特征表示分布之间的距离. 模
                 型结合域判别器, 通过对抗性预适应的方式训练特征提取网络                     (即时空图卷积网络) 以最小化源特征表示分布和
                 目标特征表示分布之间的距离, 最终学习到域不变的特征.
                    最后, 结合交通预测模块, 将源域和目标域的时空数据合并到表示学习的过程中, 进一步学习域不变和更具鉴
                 别性的特征, 并通过学习到的特征来预测目标域未来的交通流数据.

                 3.2   时空图卷积网络
                    在  TL-STGCN  的时空图卷积网络中, 采用时间注意力机制动态调整输入, 以更好地提取交通流数据的时空特
                 征表示, 并采用    GCN  构成图卷积层以提取空间特征、Gated CNN          构成时序卷积层来提取时间特征.

                 3.2.1    时间注意力机制
                    在时间维度上, 交通路网中不同时间段的交通状况之间存在相关性, 不同情况下的相关程度也不同, 例如, 相
                 邻时间段之间的交通状况关联更大. 注意力机制能够寻找需要关注的信息并根据信息的重要程度进行加权, 使模
                 型对重要的信息给予更多的关注, 以提升时间维度上的特征提取能力. 因此, TL-STGCN                      模型中采用了如下所示的
                 时间注意机制     [22] , 自适应地对数据赋予不同的权重:

                                                    ((       )             )
                                                      (   ) T   (      )
                                              E = V e ·σ  X (r−1)  U 1 U 2 U 3 X (r−1)  +b e          (4)
                                                        p           p

                                                              (  )
                                                           exp E i,j
                                                      ′                                               (5)
                                                      i,j  T r−1  (  )
                                                     E = ∑
                                                              exp E i,j
                                                            j=1
                                                                      r
                 其中,   X (r−1)  = X p ∈ R N×C r−1 ×T r−1   是第  r 层特征提取模块的输入;   C r−1  是第   层中输入数据的通道数, 当  r = 1 时,  C 0 = F
                       p
   364   365   366   367   368   369   370   371   372   373   374