Page 114 - 《软件学报》2025年第12期
P. 114
软件学报 ISSN 1000-9825, CODEN RUXUEW E-mail: jos@iscas.ac.cn
2025,36(12):5495−5511 [doi: 10.13328/j.cnki.jos.007433] [CSTR: 32375.14.jos.007433] http://www.jos.org.cn
©中国科学院软件研究所版权所有. Tel: +86-10-62562563
*
VulFewShot: 利用对比学习改进少样本漏洞分类
吴月明 1,2,4,7 , 张笑睿 1,2,4,7 , 李 志 1,2,4,5,7 , 刘恺麟 3,4,7 , 邹德清 1,2,4,5,7 , 金 海 1,2,4,6,8
1
(大数据技术与系统国家地方联合工程研究中心, 湖北 武汉 430074)
2
(服务计算技术与系统教育部重点实验室, 湖北 武汉 430074)
3
(分布式系统安全湖北省重点实验室, 湖北 武汉 430074)
4
(大数据安全湖北省工程研究中心, 湖北 武汉 430074)
5
(金银湖实验室, 湖北 武汉 430074)
6
(集群与网格计算湖北省重点实验室, 湖北 武汉 430074)
7
(华中科技大学 网络空间安全学院, 湖北 武汉 430074)
8
(华中科技大学 计算机科学与技术学院, 湖北 武汉 430074)
通信作者: 李志, E-mail: lizhi16@hust.edu.cn
摘 要: 为了对漏洞进行细粒度检测, 理想的模型必须确定软件是否包含漏洞, 并确定漏洞的类型 (即进行漏洞分
类). 一系列深度学习模型在漏洞分类任务中取得了良好的整体性能. 然而, 观察到不同漏洞类型之间存在严重的数
据不平衡. 许多漏洞类型只有少量的漏洞样本 (称为少样本类型), 这导致了对少样本类型的分类性能和泛化能力
较差. 为了提高少样本漏洞类型的分类性能, 实现 VulFewShot. 这种基于对比学习的漏洞分类框架通过使相同类型
的漏洞样本“接近”, 同时使不同类型的漏洞样本彼此“远离”, 从而为仅有少数漏洞样本类型赋予了更多的权重. 实
验结果表明, VulFewShot 可以提高对所有类型漏洞的分类性能. 类型包含的漏洞样本数量越少, 改进就越显著. 因
此, VulFewShot 可以提高样本不足的漏洞的分类性能, 并减少样本量对学习过程的影响.
关键词: 漏洞分类; 少样本; 对比学习
中图法分类号: TP311
中文引用格式: 吴月明, 张笑睿, 李志, 刘恺麟, 邹德清, 金海. VulFewShot: 利用对比学习改进少样本漏洞分类. 软件学报, 2025,
36(12): 5495–5511. http://www.jos.org.cn/1000-9825/7433.htm
英文引用格式: Wu YM, Zhang XR, Li Z, Liu KL, Zou DQ, Jin H. VulFewShot: Improving Few-shot Vulnerability Classification by
Contrastive Learning. Ruan Jian Xue Bao/Journal of Software, 2025, 36(12): 5495–5511 (in Chinese). http://www.jos.org.cn/1000-9825/
7433.htm
VulFewShot: Improving Few-shot Vulnerability Classification by Contrastive Learning
WU Yue-Ming 1,2,4,7 , ZHANG Xiao-Rui 1,2,4,7 , LI Zhi 1,2,4,5,7 , LIU Kai-Lin 3,4,7 , ZOU De-Qing 1,2,4,5,7 , JIN Hai 1,2,4,6,8
1
(National Engineering Research Center for Big Data Technology and System, Wuhan 430074, China)
2
(Services Computing Technology and System Lab, Wuhan 430074, China)
3
(Hubei Key Laboratory of Distributed System Security, Wuhan 430074, China)
4
(Hubei Engineering Research Center on Big Data Security, Wuhan 430074, China)
5
(Jinyinhu Laboratory, Wuhan 430074, China)
6
(Cluster and Grid Computing Lab, Wuhan 430074, China)
7
(School of Cyber Science and Engineering, Huazhong University of Science and Technology, Wuhan 430074, China)
8
(School of Computer Science and Technology, Huazhong University of Science and Technology, Wuhan 430074, China)
* 基金项目: 国家自然科学基金 (62202191)
收稿时间: 2024-05-30; 修改时间: 2024-10-10, 2025-01-21; 采用时间: 2025-03-25; jos 在线出版时间: 2025-07-23
CNKI 网络首发时间: 2025-07-24

