Page 422 - 《软件学报》2025年第4期
P. 422

1828                                                       软件学报  2025  年第  36  卷第  4  期


                                                                 (l)
                                                              (l)
                                                                     (l)
                                                  H (l+1)  = Γ (l)  f((Γ H ),Θ )                     (49)
                                                         f∗τ  b∗τ  d
                 其中,    Γ  表示前面的一维扩展卷积核,       Γ  表示后面的一维扩展卷积核,         Θ (l)   表示谱超图卷积核,   H (l+1)   表示第  l+1
                       f                        b
                 层输出. 该部分可以用图       8  表示, 图中进行了两次卷积操作, 分别用          Γ 和  Γ  进行表示,   ⊙ 表示  Hadamard  积,   ∗ 表示
                                                                         ′
                 标准卷积.

                                              ST block
                                                                     Y i
                                            Temporal Conv
                                             Hypergraph
                                                                        1D-
                                                                 1D-
                                               Conv             Conv#1  Conv#2
                                            Temporal Conv            Γ      Γ′
                                                 ~
                                            Temporal Conv       1−σ Sig  σ Sig  σ Sig
                                             Hypergraph
                                               Conv
                 5.1   基于时间序列的大模型
                                            Temporal Conv            Y o


                                              图 8 DSTHGCN   的时间卷积部分      [39]

                    基于动态超图的时空融合架构总结可见表               4.

                                              表 4 基于动态超图的时空融合架构

                    方法       类型                      算法描述                           缺陷           应用
                                   在时空超图卷积模块采用内注意力和外注意力机制学习空间
                  DyHCN [40]       维度的节点和超边的嵌入传播, 并与通过线性转换得到的时间                随着节点和超边数量      股票价格预测
                                                                               增长, 计算量较大
                                   嵌入连接融合, 再通过基于LSTM的协同预测学习时间依赖
                                   串联分别通过直接卷积对空间和犯罪、时间和犯罪进行的局 随着节点和超边数量
                  ST-HSL [38]  非谱域方法                                                            犯罪预测
                                   部编码, 并通过对比学习协同学习局部和全局空间和时间关系 增长, 计算量较大
                                   通过推导出的超图关联矩阵进行超图卷积更新节点表示, 用交
                  DyHSL [41]       互式图卷积建模高阶时空关系并整合成多尺度提取模块进行                  由于模型减少了参数,      交通流预测
                                                                               可能有过拟合风险
                                   局部池化提取时间信息
                                   分别根据地铁网络拓扑和地铁流量构造两级超图并连接成一
                         [39]                                                  超图结构是预定义的,
                 DSTHGCN    谱域方法 个超图, 通过谱域直接超图卷积提取空间信息, 并前后与时间                                地铁客流预测
                                   卷积层串联和门控机制融合时空信息                            不具有自适应性

                 5   时空大模型

                    大模型, 具体指大语言模型         (LLM) 和预训练基础模型       (PFM) [16] , 是深度学习领域的一项新兴技术, 具有参数
                 数量庞大, 层数较多等特点. 目前基于大模型的研究主要在自然语言处理、计算机视觉和多模态融合方面取得突
                 破性进展. 而在时间和空间信息融合的挖掘上, 大模型也展现出广阔的前景. 因此在本节中, 面向两种与时空信息
                 提取相关的不同类型的数据进行大模型的介绍, 分别为时间序列和图.


                    时序预测作为一项在时间序列中预测未来趋势的任务, 通常面临长距离依赖, 高维数据和对抗噪声等关键问
                 题. 而大模型的出现有助于有效解决上述问题, 成为气候预测、金融风险预测、交通预测等领域的有力工具. 基于
                 时序的大模型研究主要可分为两大类, 第             1  类是时序领域基础大模型, 第       2  类是使用现有大模型处理时间序列, 在
                 本节中将分别对这两类研究进行简要的介绍.

                 5.1.1    时序领域基础大模型
                    TimeGPT  [42] 是美国  Nixtla 公司提出的业界第  1  个基于时间序列的预训练基础通用大模型. 由于              Transformer
   417   418   419   420   421   422   423   424   425   426   427