Page 388 - 《软件学报》2025年第5期
P. 388
软件学报 ISSN 1000-9825, CODEN RUXUEW E-mail: jos@iscas.ac.cn
2025,36(5):2288−2307 [doi: 10.13328/j.cnki.jos.007211] [CSTR: 32375.14.jos.007211] http://www.jos.org.cn
©中国科学院软件研究所版权所有. Tel: +86-10-62562563
*
基于半监督和自监督图表示学习的恶意节点检测
王晨旭 1,2 , 王凯月 1 , 王梦勤 1
1
(西安交通大学 软件学院, 陕西 西安 710049)
2
(智能网络与网络安全教育部重点实验室 (西安交通大学), 陕西 西安 710049)
通信作者: 王晨旭, E-mail: cxwang@mail.xjtu.edu.cn
摘 要: 现实场景中, 电子商务、消费点评、社交网络等不同平台用户之间往往存在着丰富的交互关系, 将其构建
成图结构, 并基于图神经网络 GNN 进行恶意用户检测已成为相关领域近几年的研究趋势. 然而, 由于恶意用户通
常占比较小且存在伪装和标记成本高的情况, 导致了数据不平衡、数据不一致和标签稀缺等问题, 从而使传统
GNN 方法的效果受到了一定的限制. 提出基于半监督图表示学习的恶意节点检测方法, 该方法通过改进的 GNN
方法进行图节点表示学习并对图中节点分类. 具体地, 构造类别感知的恶意节点检测方法 (class-aware malicious
node detection, CAMD), 引入类别感知注意力系数、不一致图神经网络编码器、类别感知不平衡损失函数以解决
数据不一致与不平衡问题. 接下来, 针对 CAMD 在标签稀缺情况下检测效果受限的问题, 提出基于图对比学习的
方法 CAMD , 引入数据增强、自监督图对比学习及类别感知图对比学习, 使模型可以从未标记的数据中学习更多
+
信息并充分利用稀缺的标签信息. 最后, 在真实数据集上的大量实验结果验证所提方法优于所有基线方法, 且在不
同程度的标签稀缺情况下都表现出良好的检测效果.
关键词: 恶意节点检测; 图神经网络; 表示学习
中图法分类号: TP393
中文引用格式: 王晨旭, 王凯月, 王梦勤. 基于半监督和自监督图表示学习的恶意节点检测. 软件学报, 2025, 36(5): 2288–2307.
http://www.jos.org.cn/1000-9825/7211.htm
英文引用格式: Wang CX, Wang KY, Wang MQ. Malicious Node Detection Based on Semi-supervised and Self-supervised Graph
Representation Learning. Ruan Jian Xue Bao/Journal of Software, 2025, 36(5): 2288–2307 (in Chinese). http://www.jos.org.cn/1000 -
9825/7211.htm
Malicious Node Detection Based on Semi-supervised and Self-supervised Graph Representation
Learning
1,2
1
WANG Chen-Xu , WANG Kai-Yue , WANG Meng-Qin 1
1
(School of Software Engineering, Xi’an Jiaotong University, Xi’an 710049, China)
2
(Ministry of Education Key Lab for Intelligent Networks and Network Security (Xi’an Jiaotong University), Xi’an 710049, China)
Abstract: In real-world scenarios, rich interaction relationships often exist among users on different platforms such as e-commerce,
consumer reviews, and social networks. Constructing these relationships into a graph structure and applying graph neural network (GNN)
for malicious user detection has become a research trend in related fields in recent years. However, due to the small proportion of
malicious users, as well as their disguises and high labeling costs, traditional GNN methods are limited by problems suchas data
imbalance, data inconsistency, and label scarcity. This study proposes a semi-supervised graph representation learning-based method for
detecting malicious nodes. The method improves the GNN method for node representation learning and classification. Specifically, a class-
aware malicious node detection (CAMD) method is constructed, which introduces a class-aware attention mechanism, inconsistent GNN
* 基金项目: 国家自然科学基金 (62272379, T2341003); 陕西省自然科学基金 (2021JM-018); 中央高校基本科研业务费专项资金 (xzy
012023068)
收稿时间: 2023-05-10; 修改时间: 2023-11-03; 采用时间: 2024-04-16; jos 在线出版时间: 2024-06-20
CNKI 网络首发时间: 2024-06-21