Page 406 - 《软件学报》2025年第4期
P. 406

1812                                                       软件学报  2025  年第  36  卷第  4  期


                 dimensions.  The  latest  research  related  to  spatio-temporal  graphs  is  listed  in  graph-based  large  models.  The  core  details  of  multiple  key
                 algorithms  are  introduced,  and  the  pros  and  cons  of  different  methods  are  compared.  Finally,  the  application  fields  and  commonly  used
                 datasets of complex spatio-temporal data mining methods based on graph neural networks are listed, and possible future research directions
                 are outlined.
                 Key words:  complex spatio-temporal data mining; graph neural network (GNN); spatio-temporal large model

                 1   背景与分类


                    时空数据挖掘是指对时空数据中时间和空间维度之间的相互作用进行模式识别的方法                               [1] . 与传统单一维度的
                 数据挖掘相比, 时空数据挖掘需要对两个维度的数据模式进行提取, 而时间和空间维度的信息具有相关性和异质
                 性, 因此该方法具有更高的复杂性          [2] . 近年来, 时空数据挖掘通常应用于交通、气候、犯罪预测等领域, 具有广泛
                 的应用前景. 然而在面对复杂、动态变化这两种不同特性的时空关系时, 传统的时空数据挖掘方法无法较好地拟
                 合非线性关系, 同时需要手动进行特征工程, 这使得传统方法无法较好地解决数据量较大, 计算复杂度较高的复杂
                 时空数据挖掘问题. 近年来, 图神经网络作为一类深度学习框架在处理图数据展现出了强大的建模和预测能力. 然
                 而, 时空数据挖掘任务通常面临着收集的跨区域和跨时间的时空图数据具有分布偏差的问题, 此外, 现有时空图模
                 型缺乏可解释性和可扩展性          [3] , 因此如何应用基于图神经网络的复杂时空数据挖掘方法以应对这些挑战成为研究
                 人员关注的热点. 我们将基于这类新技术的时空融合架构根据图的类型                        [4] 进行分类, 分别是基于动态图、动态异
                 质图和动态超图的时空融合架构.
                    由于复杂时空数据与简单时空数据在数据结构、数据特征、数据关系以及数据处理方法上存在着显著差异,
                 需要针对它们不同的特点采用相应的处理和挖掘策略. 其中, 本文将主要聚焦于对复杂时空数据挖掘方法进行介
                 绍. 如表  1  所示, 表中展示了简单时空数据和复杂时空数据的对比.

                                             表 1 简单时空数据和复杂时空数据对比

                   比较项                   简单时空数据                                 复杂时空数据
                           结构简单, 时间维度大多为一维, 空间维度则为二维, 多 结构复杂, 可能具有多维结构且具有异质性, 多以时空
                  数据结构
                           以网格的形式存在               ST-GFSL
                                                                   图的形式存在
                                                                   特征复杂多样, 包含大量的时空相关属性且属性间具
                  数据特征     特征较少且表示的含义较为简单
                                                                   有关联性
                  数据关系     时空数据间关系较为简单, 通常为线性关系                    时空数据间关系较为复杂, 可能具有非线性和相关性
                 数据处理方法 传统的统计方法和机器学习方法                             时序图神经网络和其他深度学习方法的结合

                    当今结合简单的图神经网络的时空数据挖掘方法主要是基于成对、同质的时空图, 而不涉及异质性和超边.
                 近年来, 图卷积神经网络方法被广泛应用在时空图的空间信息提取上, 它可以与时间序列预测方法以串联或耦合
                 的方式提取时空信息. 例如, Yu         等人  [5] 提出的经典时空融合架构        STGCN  首次将谱域图卷积神经网络           (谱域
                                 [7]
                     [6]
                 GCN) 和  Gated TCN 模块串联提取时空信息; Qian       等人  [8] 提出的  DeepSTUQ  则通过将  GRU 中的线性单元替
                                                                                          [9]
                 换成图卷积算子, 并结合节点自适应参数学习              (NAPL) 模块  [10] , 以耦合的方式学习时空关系. 除了基于图卷积神经
                 网络的方法, 还有应用注意力机制的时空融合架构, 这类方法能够更好地考虑到其他因素对不同节点的重要性, 增
                 强节点的表达能力. 例如       Lu  等人  [11] 提出的      结合了元学习的方法, 引入了图注意网络             (GAT) [12] 和可调节
                 的参数来学习时空融合信息. 为了更好地融合图卷积网络和注意力机制的优点, Guo 等人                            [13] 提出的  ASTGCN
                 在时间和空间维度分别应用了注意力机制, 与图卷积神经网络耦合, 接着和时间卷积串联, 从而实现时空融合.
                    除了针对简单时空图的时空图神经网络方法, 近年来还涌现了不少针对复杂图的复杂时空融合架构, 而现有
                 综述对基于动态异质图的时空融合架构的介绍较为简单粗略, 且缺乏对基于动态超图的时空融合架构的介绍. 因
                 此, 本文针对不同类型的复杂图, 将时空融合架构划分成基于动态图、动态异质图和动态超图这                              3  大类.
                    (1) 基于动态图的时空融合架构
                    根据时间粒度的粗细, 基于离散时间动态图的时空融合方法中时间被划分成多个快照, 每个快照对应一个静
   401   402   403   404   405   406   407   408   409   410   411