Page 417 - 《软件学报》2025年第4期
P. 417

邹慧琪 等: 基于图神经网络的复杂时空数据挖掘方法综述                                                     1823


                 式的异构关系, Zhou    等人  [32] 提出了  MOHER. 该模型构建的异质图中节点是所有不同交通方式站点的集合, 异质
                 边包括不同关系类型. 由于不同交通模式与地理邻近度/兴趣点                    (POI) 相似度构建的复合关系是异质的, 因此可以
                 通过建立模式内      (如地铁站) 和模式间     (如地铁站和出租车服务点间) 站点之间的多重复合关系                  [32] 得到异质边的类
                 型. MOHER  中空间信息提取部分主要包括模内关系和模间关系编码和一个跨模式                         GCN (CMR-GCN) 模块, 时间
                 提取部分为    LSTM [33] 模块, 它们通过串联的方式实现时空信息的融合.
                    通过地理邻近度和       POI 相似度对模内关系和模间关系进行编码, 并且构建跨模局部图后, MOHER                      设计了跨
                 模式关系图卷积网络       (CMR-GCN) 对各种异质跨模式关系的相关性和差异性进行显式建模, 提取空间维度的人流
                                                                            l+1 层模块中不同异构关系的相关性
                 信息. 具体来说, 对于构建的局部图中除去规划的目标节点的其他节点                     v i  , 第
                 {C l+1 |r ∈ R} 可用如下公式表示为:

                   i,r
                                                          (             )
                                                      ∑     ε r,ij
                                                                 l
                                                                   l
                                                 C i,r l+1  =  σ  x W +b l r,c                       (30)
                                                                   r,c
                                                                 j
                                                           |N r (i)|
                                                      j∈N r (i)
                                                                                           l
                                                         i
                             l
                      l                                                          l       {b |r ∈ R} 分别是关
                                    j
                                                                j
                 其中,   x  表示第   层节点   的节点特征,   ε r,ij  表示节点   和节点   构成的边的特征,   {W |r ∈ R} 和
                       j                                                         r,c       r,c
                                                                    r
                 系类型为   r 的待训练权重矩阵和偏置,        N r (i) 表示节点  v i  关系类别为   的邻居节点的集合. 除此之外, 采用不同交通方
                 式, 在同一区域内的人流特征之间也存在差异性. 因此, 跨模式节点特征的差异性                      {D l+1 |r ∈ R} 可用如下公式表示为:
                                                                                i,r

                                                        (                 )
                                                    ∑     ε r,ij  l

                                                                     l
                                                                  l
                                               D l+1  =  ω    x − x W +b l                         (31)
                                                i,r            j  i  r,d  r,d
                                                         |N r (i)|
                                                    j∈N r (i)

                       l  l                                                         l+1  可通过不同类型的异
                 其中,    x − x  表示节点   v i  和邻居节点  v j  差值的绝对值,   ω 是  tanh 函数, 第   l+1 层的输出  x
                       j  i                                                           i
                                                       l
                 构关系的相关性和差异性累加并与第             l 层的输出  x  得到, 这个更新迭代过程可由以下公式表示:
                                                       i

                                                                       
                                                            ∑
                                                                       
                                                      x W +
                                                 x l+1  = σ  l  p l  (C  l+1  + D )               (32)
                                                      
                                                                     l+1 
                                                       i
                                                  i
                                                                     i,r 
                                                                 i,r
                                                             r∈R
                          L 个消息传递层的                                        1  2   L
                    对于有                  CMR-GCNs, 节点  v i  的节点表示可通过拼接    x , x ,..., x  得到.
                                                                                  i
                                                                           i
                                                                             i
                    从上述过程可以发现, 对于相同的关系类型              r  , MOHER  通过将节点和边的特征值进行简单加权, 从而得到节
                   v i  的相关性和差异性表示. 在经过                                                            通过选
                                                               v i  的节点表示后, 为了提升计算效率, MOHER
                                              CMR-GCNs 得到节点
                 点     进行提取, 最后通过串联的方式融合时空信息.
                 择特定关系类型下与目标节点相关性最高的节点得到目标节点的最终表示. 因此, 目标节点                             v 0  的表示可用如下公
                 式表示为:

                                                         (        )
                                                                                                     (33)

                                                     h = || ε v 0,r  ·g r r ∈ R v 0
                                                                      r
                 其中,   R v 0   是关系   R 的子集, 包括连接到节点   v 0  的所有关系,   g r  是关系   下与节点  v 0  连接的相关性最高的节点的表
                       是边的特征值. 通过      MOHER      L 层                                             v 0  表示.
                 示,                           中的      CMR-GCNs 和最大池化层后可得到不同时间的目标节点
                    ε v 0,r
                 在时间维度, MOHER     将这些不同时间的      v 0  表示通过  LSTM  提取时间信息, 以串联方式融合时空信息.
                    MOHER  中的对于异质图中点信息聚合的处理仅基于简单的加权, 而无法进行自适应的学习, 可能无法对异
                 质图中点的语义信息进行充分的提取. 为了应对低流量道路上车流较少、统计值变化剧烈导致难以观测, 以及统
                 计值对噪音敏感等挑战, Zhang       等人  [34] 提出了一个  T-Closure 框架, 该框架可用于基于     GPS  的轨迹表示学习或轨
                 迹异常检测等相关任务. 在其时空融合部分, 空间信息通过设计的                       MVH-GNN  网络进行提取, 时间信息通过
                 LSTM [33]
                    T-Closure 中涉及  3  种主要的异质节点, 分别是经过节点、规划节点和扩展节点, 经过节点是轨迹实际经过的
                 节点, 规划节点是原定规划经过的轨迹中的节点, 扩展节点表示目标道路的一跳邻域内不在经过轨迹和规划轨迹
                 中的节点, 其中, 经过轨迹和规划轨迹分别是由经过节点和规划节点形成的路径.
                    根据上述    3  种不同类型的节点可以划分成不同的视图, 分别为经过节点构建的通过视图, 规划节点构建的规
                 划视图和扩展节点构建的扩展视图, 这            3  种视图表示从    3  种角度提取不同类型节点和边的信息. 在合并边的嵌入
                 得到边的空间信息表示后, 需要对类别内的节点相关性进行建模. 因此, MVH-GNN                       引入了加权的注意力机制, 权
                 重可代表不同节点在同一视图中的重要性. 以通过节点的视图为例, 节点                      v i  的邻居节点  v j  的权重可以用如下公式
   412   413   414   415   416   417   418   419   420   421   422