Page 408 - 《软件学报》2025年第4期
P. 408

1814                                                       软件学报  2025  年第  36  卷第  4  期


                 2   相关综述工作

                    近年来, 随着应用场景日益丰富, 时空数据挖掘逐渐成为热点研究领域. 为了方便后来的研究者快速了解该领
                 域的最新进展, 不少基于时空数据挖掘的相关综述被发表出来. 其中, Liu                   等人  [14] 从基于输出的融合、基于输入的
                 融合和基于输入输出双阶段的融合这             3  个方面阐述了基于深度学习的城市大数据融合方法. Jiang               等人  [15] 总结了
                 图神经网络用于交通预测的方法和数据集. Jin             等人  [3] 对城市计算中的时空图神经网络进行了介绍和总结, 在这篇
                 综述中对时空图神经网络中常用的基本深度学习架构和复杂的结合了流行先进技术的时空融合架构也进行了介
                 绍, 并对该领域未来的研究方向提出了展望. Jin           等人  [16] 则对时间序列和时空数据方面的大模型进行了相关介绍.
                    尽管现在已经有许多关于时空数据挖掘领域的综述, 但它们仍存在以下缺陷: (1) 现有综述对于时空数据挖掘
                 领域的方法缺乏更细致的分类框架, 如            Liu  等人  [14] 仅从基于深度学习输入、输出和输入输出双阶段的角度简要介
                 绍了时空数据融合的方式, 而没有从动态图、动态异质图、动态超图角度对时空图中基于图神经网络的融合方法
                 进行更细致的分类介绍. (2) 由于在时空数据挖掘领域的方法日新月异, 新技术被广泛探索. 然而, 当前综述没有对
                 基于图神经网络的复杂时空数据挖掘方法进行更全面和深入的归纳总结. 例如                          Jin  等人  [3] 的综述仅对城市交通领
                 域中的时空数据挖掘方法进行了介绍, 简要介绍了基于简单动态图的时空数据挖掘技术, 缺乏了对于其他应用领
                 域和更新的复杂类型的图         (如动态超图) 的潜在方法介绍, 且对基于动态异质图的相关复杂数据挖掘方法介绍较
                 为粗略. (3) 现有综述缺乏对与时空图大模型相关的大模型的详细总结. 例如                     Jin  等人  [16] 的综述虽然总结了时空数
                 据相关的大模型, 而没有更聚焦到与时空图这种数据类型有关的时间和空间维度的大模型, 即基于时间序列和图
                 的大模型进行详尽的介绍.
                    综上所述, 目前对于时空数据挖掘领域缺乏基于图神经网络更细致和全面的分类和总结工作. 为此, 本文针对
                 时空图和不同的应用领域, 同时结合了最新的技术方法提出了更系统性的分类框架并进行了总结. 本文第                                  3  节给
                 出了文中涉及的几种数据类型和时空数据挖掘任务的相关定义. 第                      4  节分别从动态图、动态异质图、动态超图对
                 时空融合架构进行详细阐述以及分类比较. 第               5  节介绍基于   2  种时空数据类型, 即时间序列和图的时空大模型方
                 法. 第  6  节介绍时空数据挖掘领域的相关应用. 第          7  节给出时空数据挖掘方法比较常用的数据集. 第              8  节对时空数
                 据挖掘领域未来的研究方向进行展望和总结.
                   是动态异质图上的节点, 它们的属性可能会随着时间发生改变,
                 3   概念与定义

                    在本节中, 我们将对本文涉及的几类数据类型和时空数据挖掘任务进行定义.
                    定义   1. 动态图. 动态图是一类节点属性和节点间连接关系可能会随时间发生改变的图, 可以被定义为
                  (t)  (t)  (t)  (t)  (t)          (t)                   (t)                  (t)  代表节点的
                 G = {V ,E ,X } , 其中  G   代表动态图,   V   代表动态图上的节点集,      E   代表动态图上的边集,       X
                 属性.
                    定义  2. 动态异质图. 动态异质图是一类具有不同类型的边和节点, 且节点属性和边可能会随时间发生变化的
                                (t)  (t)  (t)  (t)        (t)              (t)                       (t)  代
                 图, 可以被定义为     G = {V ,E ,X ,B (v) ,B (e) } , 其中   G   代表动态异质图,   V   代表动态异质图上的节点集,   E
                 表动态异质图上的边集,         X (t)   代表节点的属性,   B (v)  代表节点的种类集合,   B (e)  代表边的种类集合, 且二者满足

                                                                           R 1  R 2  R k
                 B (v)  + B (e)  > 2 . 元路径   P 代表动态异质图上任意两个节点之间的路径, 记为   v 1 −→ v 2 −→ ... −→ v k+1 {v 1 ,v 2 ,...,v k+1 }
                                                                                             ,
                                                                  R i  是节点之间的关系.
                    定义  3. 动态超图. 动态超图中一条边可能连接多个节点, 同时连接关系和节点属性具有动态性, 可以定义它
                    (t)  (t)  (t)    (t)            (t)                                  H  , 该矩阵可以表示
                 为   G = {V ,E } , 其中  G   代表动态超图,   V   代表动态超图上的节点集. 定义一个关联矩阵
                                      (t)      (t)
                 超图的结构. 对于节点      v ∈ V   和边   e ∈ E   ,   H  可表示如下:

                                                           
                                                            1, v ∈ e
                                                           
                                                                    .
                                                           
                                                    H(v,e) = 
                                                            0, v < e
                                                           
                    如果超边具有权重, 关联矩阵可以定义为:
   403   404   405   406   407   408   409   410   411   412   413