Page 410 - 《软件学报》2025年第9期

P. 410

何玉林等: 基于时空注意力的多粒度链路预测算法 4321

NC-LGBM 比 PR-CN 预测性能有所提升, 但由于输入的多种相似性指数特征难以表示社交网络的复杂特征而使
得其预测能力受限. 与这类方法不同, 本文没有构建具体的网络相似性指数, 而是通过建立深度学习模型来建模社
交网络的时空特征, 从社交网络数据中自适应地提取出深层的抽象特征.

表 2 SAMG-LP 与基准算法性能比较

Haggle LH10 LyonSchool workplace
算法
AUC MR Recall AUC MR Recall AUC MR Recall AUC MR Recall
PR-CN 0.864 0.107 0.791 0.806 0.091 0.691 0.714 0.101 0.494 0.814 0.059 0.680
NC-LGBM 0.851 0.124 0.814 0.810 0.261 0.876 0.884 0.095 0.807 0.655 0.545 0.853
MljFE 0.804 0.283 0.734 0.896 0.112 0.821 0.923 0.083 0.894 0.619 0.903 0.897
LPANMF 0.867 0.105 0.824 0.853 0.092 0.770 0.878 0.136 0.838 0.702 0.091 0.495
GC-LSTM 0.902 0.043 0.826 0.896 0.107 0.824 0.862 0.099 0.771 0.827 0.062 0.701
SRG 0.887 0.062 0.802 0.831 0.083 0.719 0.893 0.315 0.867 0.931 0.078 0.901
GCN_MA 0.887 0.072 0.824 0.911 0.091 0.854 0.889 0.167 0.933 0.908 0.088 0.872
SAMG-LP 0.915 0.039 0.853 0.942 0.072 0.898 0.924 0.081 0.900 0.965 0.049 0.942

2) 与 2 种基于矩阵分解的方法相比, SAMG-LP 在 AUC、MR 和 Recall 指标上比 MljFE 平均取得了 18.7%、
54.7% 和 7.8% 的性能提升; 比 LPANMF 平均取得了 14.7%、42.8% 和 29.5% 的性能提升. MljFE 虽然考虑了网络
的动态性和拓扑结构, 并通过非负矩阵分解的方式建立目标函数, 然后使用优化后的特征矩阵和参数矩阵完成链
路预测, 但这种简单的矩阵分解难以学习复杂的非线性关系, 它的特征表示能力有限, 导致预测性能一般.
LPANMF 在邻接矩阵中加入了攻击者矩阵, 并通过对抗训练学习节点的低维表示, 这一定程度提高了模型的特征
提取能力, 但该算法只考虑了网络的稀疏性和空间结构, 忽略了网络的时间动态性, 使得学习到的节点表示不够全
面, 链路预测能力有限. 而本文的算法首先利用多头注意力神经网络从时间维度提取时间特征, 然后利用基于数据
驱动学习到的拓扑结构从空间维度提取空间特征, 并考虑网络的稀疏性以提高节点的表示能力, 在理论层面上更
为合理, 实验结果也证明了本文算法相比于基于矩阵分解的方法预测性能更好.
3) 与 3 种基于深度学习的方法相比, SAMG-LP 除了在 LyonSchool 数据集上, 与 GCN_MA 模型相比在
Recall 指标上取得了次优的结果外, 其余情况都取得了最优的结果. 这 3 种基于深度学习的方法都考虑了社交网
络的时间信息和空间结构信息, 预测性能较好, 这也证明了基于深度学习的方法在链路预测问题上的优势, 但它们
也存在一些局限性. GC-LSTM 对 LSTM 模型进行改进, 将 GCN 嵌入到 LSTM 的内部结构中来同时提取网络快照
序列的时空特征, 但其预测性能不如 SAMG-LP, 这是因为相比于本文算法, GC-LSTM 只能学习到短期的空间特
征和局部的时间特征. SRG 深度生成模型设计了基于条件归一化流的 DGFlow 模块, 实现 LR 图与 HR 图的转换,
利用 LR 图对未来 HR 图进行预测, 进而通过 DGFlow 将未来 HR 图生成未来网络. SRG 简单地考虑网络的拓扑
结构, 忽略了节点间的影响程度不同, 且在训练过程没有考虑到复杂网络的稀疏特性. GCN_MA 利用 LSTM 更新
GCN 参数来同时建模局部时间特征和空间特征, 然后基于多头注意力机制从全局角度建模时间特征. 虽然 GCN_
MA 在 Recall 指标上具有良好的竞争力, 但其整体表现不如 SAMG-LP, 这是由于 GCN_MA 只考虑了单一粒度的
社交网络时间序列, 无法学习到它的中、长期趋势, 且在考虑空间特征时只从预先定义的社交网络结构出发, 无法
自适应地从数据中学习到社交网络的拓扑结构, 进而更有效地学习到社交网络的空间结构信息. 与 GCN_MA 相
比, SAMG-LP 可以从多个不同粒度的社交网络时间序列中学习到信息更丰富的时空特征, 并从稀疏惩罚损失函
数考虑到了社交网络的稀疏性, 这使得 SAMG-LP 的综合预测性能更好.

3.4 消融实验
为了进一步验证 SAMG-LP 算法中各组件的有效性, 本文在 4 种真实的社交网络数据集上进行消融实验并进
行分析. 本文设计了不同网络结构和损失函数的 SAMG-LP 算法变体, 具体地, model0 表示仅使用原始社交网络快
照序列的单粒度模型, 探究中、长期粒度社交网络快照序列对 SAMG-LP 算法预测性能的影响; model1 表示仅使
用单头注意力机制提取时间特征的 SAMG-LP 算法, 探究社交网络多元演化对预测性能的影响程度; model2 表示
仅使用历史邻居矩阵进行图卷积的 SAMG-LP 算法, 探究自适应提取拓扑结构的组件对 SAMG-LP 算法的预测性

405 406 407 408 409 410 411 412 413 414 415