Page 421 - 《软件学报》2025年第4期
P. 421
邹慧琪 等: 基于图神经网络的复杂时空数据挖掘方法综述 1827
在局部角度, ST-HSL 构建了分层卷积编码器来建模犯罪数据的时空关联性. 具体来说, 在空间维度, 为了对
不同类型的空间犯罪模式进行编码, ST-HSL 使用了一个卷积核, 在空间维度和犯罪类型维度上同时进行卷积操
作, 用以建模局部区域的犯罪依赖关系. 为了缓解梯度消失的问题, 在对嵌入进行完卷积操作后需要进行残差连接
(R)
和相加操作, 再得到犯罪编码 H t,c . 该过程可用如下公式进行表示:
(R)
(R)
H t,c = σ(δ(W c (R) ∗ E t +b )+ E t,c ) (44)
c
(R) I×J×C×d R×d t 时
其中, H t,c 为局部区域空间维度分层卷积的犯罪编码, E t ∈ R 表示在 t 时刻的犯罪嵌入, E t,c ∈ R 是在
刻, 犯罪类型为 c 的犯罪嵌入, W (R) 和 b (R) 分别是犯罪类型为 c 时的卷积核和待训练偏置, ∗ 表示标准卷积, R 表示
c c
I
区域数, (R) 表示不同区域的空间维度, 和 J 分别表示城市区域图中行和列划分的区域数量, C 表示犯罪类型, d
(R)
表示初始的嵌入维度, δ(·) 表示 dropout 函数. 在空间维度得到局部区域空间维度分层卷积的犯罪编码 H t,c 后, 将
上述的编码器叠加两层获得局部区域空间维度的最终犯罪表示 H (R) ∈ R R×T×C×d .
类似地, 在时间维度, 对于不同犯罪类型的时间犯罪编码, ST-HSL 在时间维度和犯罪类型维度上进行卷积操
作, 用来建模相邻时间段内犯罪发生的时间依赖性. 该过程可用如下公式进行表示:
(R)
(T)
(R)
H (T) = σ(δ(W (T) ∗ H +b )+ H t,c ) (45)
(l)
r,c c r c
(R)
d
其中, H (R) ∈ R T×C×d , H t,c ∈ R 是类型相关的空间卷积编码器的输出, W (T) 是卷积核, b (T) 是可学习的偏置, (T) 表示
r c c
时间维度, ∗ 表示标准卷积. 在时间维度得到分层卷积的犯罪编码 H (T) 后, 将上述的编码器叠加两层获得时间维度
r,c
的最终犯罪表示 H (T) ∈ R R×T×C×d .
为了获得多个空间尺度的相关性, ST-HSL 对犯罪发生的全局关联性也进行了建模. 具体来说, 在全局角度,
ST-HSL 通过提出一个超图学习框架来对全局时空进行特征学习, 提高对全局跨区域发生的犯罪事件之间依赖关
系的捕获能力, 并缓解犯罪分布差异的问题. 在空间维度, ST-HSL 利用超边来连接一组犯罪区域, 这些超边可学
习到不同空间维度的区域关联, 聚合具有相似犯罪分布的不同区域的全局信息. 假设超边的数量为 H, 超图中的消
息传递过程可用如下公式表示为:
(R)
T
Γ t = σ(H ·σ(H t · E t )) (46)
t
其中, H t ∈ R H×RC 表示信息在 t 时刻时区域和超边之间的可学习依赖关系, E t ∈ R RC×d 为 t 时刻所有区域-犯罪类别
组合的嵌入表示.
在时间维度, ST-HSL 采用了卷积操作将得到的全局空间表示和时间信息融合起来, 在这个部分, 用来捕获全
局的时间关联的卷积核尺寸相较局部时间特征编码更大. 该部分的时间关系编码器可用如下公式表示:
(R)
Γ (T) = σ(δ(V ∗Γ +c)) (47)
r,c r,c
c
c
其中, V 是待训练的卷积核, 是待训练偏置, Γ (T) ∈ R T×d 是在第 r 个区域, 犯罪类型为 的所有 T 个时间的嵌入向
r,c
量, ∗ 表示标准卷积.
利用非谱域方法进行动态超图的时空融合时, 由于不涉及将特征转换到频域, 计算开销更小, 但是可能容易受
到局部信息的干扰, 在设计相关方法时, 可能需要额外考虑对全局信息的提取.
4.3.2 谱域方法
在基于动态超图的时空融合架构中还有一类方法是基于谱域的, 相比非谱域方法, 谱域方法更关注动态超图
的全局信息, 然而处理大规模的动态超图时, 谱域方法的计算复杂度可能更高. 由于地铁线路中点与点之间具有高
阶关系, 而超边中一条边可包括多个节点, 因此 Wang 等人 [39] 提出的 DSTHGCN 分别根据地铁网络和出行流量构
建横跨小时、日、周这 3 个时间跨度的两级超图, 并连接成一个超图, 通过谱域超图卷积和时间卷积串联分别提
(l)
取空间和时间信息, 从而融合时空信息. 超图卷积部分 f(X ,Θ ) 可以表示为:
1 −1 T − 2 1 (l) (l)
(l+1)
X = σ ReLU ( e D v H d W e D e H e D v X Θ ) (48)
− 2 e e
d
e
其中, e D v 表示节点的度矩阵, e D e 表示包括自循环的超边的度矩阵, e W 表示包括自循环的权重矩阵, X (l) 表示第 l
层输入, e H d 是构建的主超图和高级超边相拼接后的矩阵与自循环拼接的关联矩阵, Θ (l) 表示谱超图卷积核, σ ReLU
表示 ReLU 激活函数.
组合了时间卷积和空间卷积的时空模块可以用如下公式表示: