Page 402 - 《软件学报》2025年第5期
P. 402
2302 软件学报 2025 年第 36 卷第 5 期
5.5.1 CAMD 消融实验
各消融项如下: CAMD\ At 去除类别感知注意力系数; CAMD\ Com 去除中间层组合机制; CAMD\ Att&Com 同时
b
b
t
W
去除类别感知注意力系数与中间层组合机制; CAMD\ R 去除不平衡损失机制中的重加权机制; CAMD\ LDAM-RW
去除类别感知不平衡损失机制. 消融实验结果如表 4 所示.
表 4 消融实验结果 (%)
Method Amazon YelpChi Wiki Tencent-Weibo T-finance
CAMD 98.21 85.31 65.89 99.22 98.04
CAMD\ Comb 96.58 75.03 64.56 99.12 97.63
97.94 83.78 65.37 98.95 97.41
CAMD\ Att
CAMD\ Att&Comb 83.20 64.62 62.55 99.02 97.17
97.79 84.47 65.18 97.52 97.77
CAMD\ RW
97.88 85.01 65.06 97.21 96.80
CAMD\ LDAM-RW
首先通过观察 CAMD\ LDAM-R 发现, 去除不平衡损失函数后各数据集上的分类 AUC 分数都有所下降, 这意
W
味着不平衡损失函数对于提升恶意节点检测任务的效果有所帮助. 此外在不一致程度较高的 Amazon 与 YelpChi
数据集上, 去除中间层组合机制与类别感知注意力系数后 AUC 分数分别都有少量的下降, 而同时去除这两种机制
则下降较多, 这首先说明本文提出的不一致图编码器在此类数据集上体现了较大的作用, 且中间层组合机制与类
别感知注意力系数这两种机制可以互相弥补另一方缺失带来的不足. 而在 Wiki、Tencent-Weibo、T-finance 数据
集上, 分别观察 CAMD\ Att , CAMD\ Com 与 b CAMD\ Att&Com 发现, 不一致图编码器起到了一定的作用, 但提升与
b
Amazon、YelpChi 相比没有那么显著, 这可能是因为 Wiki 数据集相邻节点间的特征相似性和标签相似性都较低,
导致即使使用中间层组合机制也无法获取充足的信息, 同时依靠特征信息对节点类型进行判断也较为不充分, 使
用类别感知注意力系数带来的提升有限. 而 Weibo 和 T-finance 数据集本身的不一致程度并不高, 使用传统 GNN
即可较为有效地进行恶意节点检测.
+
5.5.2 CAMD 消融实验
+ p + f +
各消融项如下所示: CAMD \ Su 去除类别感知对比学习模块; CAMD \ Sel 去除自监督对比学习模块; CAMD \ Bal-CL
+ l
去除基于类平均的不平衡对比损失; CAMD \ Ba 去除不平衡对比损失以及分类不平衡损失 L LDAM-RW . 消融实验结
果如表 5 所示.
表 5 消融实验结果 (%)
Method Amazon YelpChi Wiki Tencent-Weibo T-finance
CAMD + 96.59 80.36 61.04 99.16 97.40
+
CAMD \ Sup 96.42 80.02 58.93 98.72 85.49
+
CAMD \ Self 96.78 79.89 58.12 99.23 97.16
+
CAMD \ Bal-CL 95.63 79.05 59.01 99.09 97.24
+
CAMD \ Bal 95.68 79.57 58.20 97.48 96.30
+
首先观察 CAMD \ Sel 发现, Amazon 和 Tencent-Weibo 数据集上的分类 AUC 分数都比原始模型有了些许提
f
高, 可能的原因是自监督图对比学习的过程中可能会捕获冗余的图信息, 给节点表示向量带来噪声, 而这两个数据
+
集中的节点表示可能受噪声信息的影响较大, 因而使用自监督会使模型效果下降. 此外, 观察 CAMD \ Su 发现使
p
用标签感知对比学习对提升模型效果是有用的, 说明在这两个数据集上使用标签信息指导训练可以学习更有区分
度的节点表示, 从而提升模型效果. 而在 YelpChi 与 Wiki 数据集中, 去除自监督对比学习带来的影响要稍大于去
除类别感知对比学习的影响, 这可能是因为在这两个数据集上通过标签信息拉大不同节点表示向量的区分度带来
的提升有限, 相比之下通过自监督图对比学习可以更有效地挖掘图中包含的信息, 使得编码器可以编码得到有益
于下游节点分类任务的节点表示向量. 在 T-finance 数据集中, 观察 CAMD \ Su 可以发现, 去除类别感知对比学习
+
p
模块模型性能受影响较大, 说明在此数据集上使用标签信息可以获得较大提升. 这可能是因为在此数据集上特征