Page 403 - 《软件学报》2025年第9期
P. 403

4314                                                       软件学报  2025  年第  36  卷第  9  期


                 提高性能并保持局部方法的低复杂性优势.
                    基于相似性指数方法的另一种思路是以相似性指数作为特征, 通过不同的分类或回归模型来推断节点之间是
                 否存在链接. Kumar 等人    [8] 以  6  种节点中心性作为特征, 并通过      LGBM  分类器进行链路预测, 提出了         NC-LGBM
                 算法. Chaubey  等人  [9] 使用  Jaccard  指数、Adar 指数等多种相似性指数作为拓扑特征, 使用随机森林和             XG-Boost
                 算法进行社交网络的链路预测. Choudhury         等人  [10] 基于局部聚类系数定义了社区动态, 计算每个网络快照的社区
                 动态值得到社区动态时间序列, 基于该序列引入了时间相似度、基于相关性的相似度和时间社区感知相似度共                                     3
                 种动态相似性度量指数, 并将这         3  种相似性指数作为特征输入到多个不同的机器学习分类器中进行预测对比.
                    基于相似性指数的方法通常比较简单, 计算效率较高, 预测结果的可解释性较强, 但也存在过度依赖节点之间
                 的相似性度量, 而忽略了网络结构中的其他信息和特征的缺点, 同时需人工提取特征, 这些特征难以学习到节点之
                 间复杂的非线性关系, 导致预测效果不佳.

                 1.2   基于矩阵分解的方法
                    基于矩阵分解的链路预测方法的一般思路是将网络的邻接矩阵分解成多个低秩矩阵的乘积用于构建目标函
                 数, 通过最小化目标函数将网络中的节点和边映射到一个低维向量空间, 最后利用学习到的潜在表示预测缺失的
                 链接或者新的链接. Ma 等人       [11] 将链路预测任务建模为多标签学习任务, 基于多标签学习项、特征提取项和时间
                 平滑性项这    3  个部分建立目标函数, 并使用交替优化的方式最小化目标函数, 提出了                     MljFE. Lv  等人  [12] 提出了两
                 种新颖的链路预测算法. 他们将自编码器结构与深度非负矩阵分解模型相融合, 充分挖掘动态网络中隐藏的深层
                 次特征, 并通过图正则化和        PageRank  进一步提取网络快照中的局部和全局信息. Yan           等人  [13] 从数学推导的角度介
                 绍了用于学习列空间信息的          NMF-C  和用于学习行空间信息的        NMF-R, 最后将这些方法结合起来建立了           NMF-CR
                 模型. Lin  等人  [14] 结合原始邻接矩阵和   PageRank 构建了全局连接矩阵, 然后在局部邻接矩阵和全局连接矩阵上基
                 于自编码器的结构执行深度矩阵分解, 以获取包含丰富结构信息的全局和局部特征表示, 此外, 引入流形正则化项
                 和稀疏条件来进一步约束深度矩阵分解过程. Mahmoodi 等人                [15] 采用对抗性非负矩阵分解, 并添加基于          CN  相似
                 性的图形正则化项, 交替优化目标函数, 提出了             LPANMF  算法. Nasiri 等人  [16] 提出了  RGNMF-AN  算法, 该算法通
                 过随机游走得到相似性矩阵, 然后将相似性矩阵、原始网络结构和节点属性相结合, 从而得到目标函数. Chen                                等
                 人  [17] 提出了  FSSDNMF  算法, 它利用  CN  计算网络结构的相似性, 再利用深度非负矩阵分解将其映射到多层低维
                 潜在空间, 进一步融合稀疏性约束以完成链路预测任务. Yao                等人  [18] 将原始网络分成   3  个子网络, 应用深度非负矩
                 阵分解模型挖掘子网络内的复杂关系, 从而重建网络, 然后对重建的网络使用非负矩阵分解进行链路预测.
                    基于矩阵分解的方法可以有效地建模动态网络的时间特征和空间结构特征, 能够考虑更多影响链路预测
                 的因素, 例如网络节点的属性, 同时这些方法所涉及的模型参数较少, 具有较好的计算效率. 但这些方法难以学
                 习到数据中的非线性特征, 导致预测性能受限, 且由于计算过程涉及大量矩阵运算, 模型容易出现数值不稳定
                 的问题.

                 1.3   基于深度学习的方法
                    基于深度学习的方法目标是将图数据通过合适的深度学习模型转换为节点的特征表示, 这些模型可以有效地
                 提取网络的拓扑结构特征和时间特征, 从而有效解决链路预测任务. Min                     等人  [19] 利用图神经网络提取每个网络快
                 照中节点的空间特征, 然后设计了一种基于注意力机制的神经网络提取网络快照序列的时间特征, 使模型能够有
                 意识地对不同的历史快照进行加权关注, 从而提出了                 STGSN  模型. Jiao  等人  [20] 提出了  TVAE  算法, 该方法的思路
                 是利用编码器学习网络快照的低维嵌入, 然后使用基于自注意力机制的神经网络学习网络快照的结构特征, 接着
                 基于  LSTM  模型建模网络快照序列的时间特征, 最后使用两层全连接作为解码器完成链路预测任务. Chen 等人                           [21]
                 提出了   GC-LSTM  模型, 该模型将图卷积网络嵌入到          LSTM  中, 旨在同时学习节点的局部结构特征和动态网络的
                 时间特征. Tan  等人  [22] 设计了特征掩码、边扰动和时间步掩码这            3  种策略对图数据进行增强, 然后利用增强函数
                 生成两个视图, 接着使用图卷积网络学习两个视图的嵌入, 并设计了时间感知和频率感知的图对比学习模块, 实现
                 更具区分性的节点表示学习, 最后利用节点表示进行链路预测. 刘林峰等人                       [23] 利用多层全连接层作为编码器学习
   398   399   400   401   402   403   404   405   406   407   408