Page 412 - 《软件学报》2025年第9期
P. 412
何玉林 等: 基于时空注意力的多粒度链路预测算法 4323
在 AUC 和 Recall 指标上总体呈现增长趋势, 在 MR 指标上大致呈现下降趋势, 当 h = 16 时, SAMG-LP 算法在 3
个指标上取得最优效果.
0.92 0.12 1.0 0.18
AUC 0.94 AUC 0.08 AUC AUC
Recall 0.070 Recall 0.92 Recall Recall 0.16
0.90 0.9
MR MR 0.07 MR MR
0.065 0.92 0.90 0.11 0.14
0.88 0.8
0.06 0.88 0.7 0.12
AUC/Recall 0.86 0.055 MR AUC/Recall 0.88 0.05 MR AUC/Recall 0.86 0.10 MR AUC/Recall 0.6 0.10 MR
0.060
0.90
0.84
0.04
0.82 0.050 0.03 0.84 0.09 0.5 0.08
0.86 0.06
0.80 0.045 0.02 0.4
0.82 0.04
0.84 0.3
0.78 0.01 0.08
0.040
0.80 0.2 0.02
1 2 4 8 16 1 2 4 8 16 1 2 4 8 16 1 2 4 8 16
注意力头数 h 注意力头数 h 注意力头数 h 注意力头数 h
(a) Haggle-h (b) LH10-h (c) LyonSchool-h (d) workplace-h
0.92 0.12
AUC 0.12 AUC AUC 0.96 0.225
Recall 0.9 Recall Recall
0.90 MR 0.11 MR 0.92 MR
0.14 0.91 0.200
0.10 0.8 0.11
0.88 0.09 0.90 0.175
AUC/Recall 0.86 0.08 MR AUC/Recall 0.7 0.12 MR AUC/Recall 0.88 0.10 MR AUC/Recall 0.92 0.150 MR
0.90
0.125
0.84 0.07 0.6 0.10 0.09 0.88
0.06 0.86 0.86 0.100
0.82 0.05 0.5 0.84 0.075
0.08 0.84 0.08
0.04 0.050
0.4 0.82
16 32 64 128 16 32 64 128 16 32 64 128 16 32 64 128
时空特征嵌入维度 D 时空特征嵌入维度 D 时空特征嵌入维度 D 时空特征嵌入维度 D
(e) Haggle-D (f) LH10-D (g) LyonSchool-D (h) workplace-D
0.08 0.92 0.8
0.9 AUC 0.94 AUC AUC 0.95 AUC
Recall Recall 0.12 0.90 Recall 0.070 Recall 0.7
MR 0.07 MR MR 0.90 MR
0.92 0.065
0.8 0.11 0.88 0.6
0.06 0.86 0.060 0.5
AUC/Recall 0.7 0.05 MR AUC/Recall 0.9 0.10 MR AUC/Recall 0.84 0.055 MR AUC/Recall 0.85 0.4 MR
0.80
0.75
0.88
0.04
0.6
0.09
0.050
0.82
0.70 0.3
0.03 0.86 0.80 0.2
0.5 0.08 0.045 0.65 0.1
0.02 0.78
0.84 0.040 0.60
0.07 0
1.0 1.5 2.0 2.5 3.0 1.0 1.5 2.0 2.5 3.0 1 2 4 8 16 1.0 1.5 2.0 2.5 3.0
损失函数的惩罚系数 β 损失函数的惩罚系数 β 注意力头数 h 损失函数的惩罚系数 β
(i) Haggle-β (j) LH10-β (k) LyonSchool-β (l) workplace-β
0.92 0.0575 0.15 0.090 0.090
AUC 0.94 AUC AUC AUC
Recall Recall 0.93 Recall Recall 0.085
0.90 MR 0.0550 MR 0.14 MR 0.96 MR
0.92 0.088 0.080
0.88 0.0525 0.13 0.92 0.95
0.075
AUC/Recall 0.84 0.0475 MR AUC/Recall 0.88 0.11 MR AUC/Recall 0.91 0.086 MR AUC/Recall 0.94 0.070 MR
0.0500
0.90
0.12
0.86
0.82 0.0450 0.10 0.90 0.084 0.93 0.065
0.86 0.060
0.0425 0.09
0.80 0.92 0.055
0.08 0.89 0.082
0.0400 0.84
0.78 0.050
0.07 0.91
0 0.1 0.2 0.4 0.8 0 0.1 0.2 0.4 0.8 0 0.1 0.2 0.4 0.8 0 0.1 0.2 0.4 0.8
时间衰减参数 θ 时间衰减参数 θ 时间衰减参数 θ 时间衰减参数 θ
(m) Haggle-θ (n) LH10-θ (o) LyonSchool-θ (p) workplace-θ
图 5 参数对 SAMG-LP 算法性能的影响
由图 5(e)–图 5(h) 分析在不同数据集中, 时空特征嵌入维度对模型预测性能的影响, 可以得出, 在 Haggle、
LH10 和 workplace 数据集中, 时空特征嵌入维度 D 取值为 32 时, SAMG-LP 算法的预测性能最佳; 而在
LyonSchool 数据集中, D 取值 128 时, SAMG-LP 在 3 种评估指标中均取得最优表现. 类似地, 从图 5(i)–图 5(l) 中
分析在不同数据集中, 损失函数的惩罚系数 β 对 SAMG-LP 算法的影响, 在 Haggle 和 LH10 数据集中, 选定 β = 2
时, SAMG-LP 算法的 AUC 和 Recall 取得最大值, 且 MR 指标表现较好. 在 LyonSchool 数据集上, 随着惩罚系数
的增大, AUC 和 Recall 也在增大, 当 β = 3 时, AUC 和 Recall 均取得最大值, 此时 MR 取得次小值. 在 workplace 数
据集上, 当惩罚系数设置为 2 时, 模型的 AUC 取得最大值, 而 Recall 和 MR 取得次优的效果.
图 5(m)–图 5(p) 展示了时间衰减参数 θ 在不同数据集下对模型预测性能的影响. 可以看出, 在 4 个真实数据
集中, 随着时间衰减参数 θ 的增大, SAMG-LP 算法的 AUC 和 Recall 指标先上升后下降, 而 MR 指标则大体表现
d t = 1, 即: 所有社交网络快照的权重相同, 这导致
为先下降后上升. 具体而言, 当时间衰减参数 θ = 0 时, 衰减因子
对未来值影响较小的历史数据也被同等对待, 造成冗余信息的引入, 所以预测性能较差. 随着时间衰减参数 θ 的增
θ
加, 衰减因子 d t 逐渐减小, 即: 历史社交网络快照的权重不断降低. 当时间衰减参数 取值在 0.1–0.2 时, 模型预测

