Page 430 - 《软件学报》2025年第4期
P. 430

1836                                                       软件学报  2025  年第  36  卷第  4  期


                    带有社交信息的      Gowalla [141] , Brightkite [141] , Foursquare [142] 的用户轨迹数据集分别收集自奥斯汀、洛杉矶和纽
                 约, 并分别包含    7 355, 6 393, 13 692  个用户, 5 115, 20 596, 25 395  个位置信息和  35 696, 20 660, 21 431  个社交关系.
                    AIS [136] , GeoLife [137] , T-Drive [138] , Porto [139] 为基于  GPS  点阵的轨迹数据集. AIS [136] 记录了  2019  年  1  月  1  日–12
                 月  1  日的船只在美国附近水域的航行路线. GeoLife         [137] 收集了  2007  年  4  月–2012  年  8  月北京  182  条人行道  2 500
                 万个  GPS  位置点. T-Drive [138] 收集了北京  2008  年  2  月  2  日–2  月  8  日  10 357  辆出租车产生的  1 500  万个  GPS  位置
                 点. Porto [139] 收集了葡萄牙波尔  2011 年  8 月–2012 年  4 月  442 辆出租车产生的  1 700 万个  GPS  位置点. Chengdu [140]
                 由滴滴公司收集于       2014  年  8  月成都的出租车产生的    2 400  万个  GPS  位置点.

                 8   展望与总结

                 8.1   研究方向展望
                    基于图神经网络的复杂时空数据挖掘目前在时空融合维度和大模型方面都取得了一定进展. 然而, 由于涉及
                 时空的数据集通常规模不大, 这在一定程度上制约了这一领域的发展. 本节将讨论未来基于图神经网络的复杂时

                 空数据挖掘的几个潜在研究方向.
                    ● 在线性. 由于在时空相关的任务上, 涉及的图总是在动态变化的. 这种动态更新对模型的训练和预测时间都
                 提出了更高的要求. 如果建立一个传感器动态收集数据, 模型能够在短时间内对收集的动态数据进行重新训练和
                 预测的学习系统, 对于适应大规模变化的图数据有着重要意义.
                    ● 可解释性. 当前时空数据挖掘领域的方法是由数据驱动主导的, 而图神经网络本身的黑盒特性使得探究各
                 特征对模型的影响程度和模型预测结果的解释性不足. 以往的研究设计的模型依赖于从历史的事件中预测未来的
                 事件, 而较少考虑到事件之间的因果性. 近年来, Deng             等人  [143] 将学习到的事件因果信息加入到先验知识中, 并引
                 入特征加权模块和近似约束损失模块两个鲁棒性强的学习模块并证明了这个集成了因果效应的模型对估计独立
                 因果效应和事件预测的优势.
                    ● 大模型. 随着大模型在计算机视觉、自然语言处理和多模态等领域的广泛应用, 如何建立时空图数据挖掘
                 领域的通用或垂直领域的基础大模型, 从而实现时空领域更大规模的预测成为一项研究热点. 由于复杂图本身的
                 特性, 在基于图类型的数据上构建或应用大模型面临着许多挑战. 同时, 随着不同类型的公开数据集的丰富, 在超
                 大规模的数据集上进行多样化的学习任务将成为一大研究方向.
                    ● 迁移性. 由于时空任务涉及的应用领域和具体场景是多样化的, 而在一些应用场景上数据较难收集到. 因此,
                 将学习到的模型与具体领域知识的结合, 从而实现模型的迁移具有广阔的研究前景. 例如, ST-GFSL                          [11] 通过建立时
                 空图小样本学习框架实现跨城市知识转移.

                 8.2   总 结
                    基于图神经网络的复杂时空数据挖掘是近年来的研究热点. 本文将复杂时空数据挖掘任务分为时空融合架构
                 和时空大模型进行了介绍. 针对这两大部分, 本文给出了全面和细致的分类框架, 并对不同方法的关键思想进行了
                 介绍, 对比了它们之间的优劣. 在时空融合架构部分, 本文讨论了基于                    3  种类型时空图, 即动态图、动态异质图和
                 动态超图的时空融合方法. 在时空大模型部分, 本文根据时间维度和空间维度划分成时间序列和图, 介绍了与时空
                 图大模型相关的不同类型的大模型. 本文还总结了时空图相关的数据类型的应用领域和一些具有代表性的公开数
                 据集. 最后, 本文对基于图神经网络的复杂时空数据挖掘未来的潜在研究方向进行了展望.

                 References:
                  [1]  Hamdi  A,  Shaban  K,  Erradi  A,  Mohamed  A,  Rumi  SK,  Salim  FD.  Spatiotemporal  data  mining:  A  survey  on  challenges  and  open
                      problems. Artificial Intelligence Review, 2022, 55(2): 1441–1488. [doi: 10.1007/s10462-021-09994-y]
                  [2]  Wang SZ, Cao JN, Yu PS. Deep learning for spatio-temporal data mining: A survey. IEEE Trans. on Knowledge and Data Engineering,
                      2022, 34(8): 3681–3700. [doi: 10.1109/TKDE.2020.3025580]
                  [3]  Jin GY, Liang YX, Fang YC, Shao ZZ, Huang JC, Zhang JB, Zheng Y. Spatio-temporal graph neural networks for predictive learning in
   425   426   427   428   429   430   431   432   433   434   435