Page 286 - 《软件学报》2021年第7期
P. 286
软件学报 ISSN 1000-9825, CODEN RUXUEW E-mail: jos@iscas.ac.cn
Journal of Software,2021,32(7):22042218 [doi: 10.13328/j.cnki.jos.006257] http://www.jos.org.cn
©中国科学院软件研究所版权所有. Tel: +86-10-62562563
基于变分自编码器的异构缺陷预测特征表示方法
1
2
1
贾修一 , 张文舟 , 李伟湋 , 黄志球 3
1
(南京理工大学 计算机科学与工程学院,江苏 南京 210094)
2
(南京航空航天大学 航天学院,江苏 南京 210016)
3 (南京航空航天大学 计算机科学与技术学院,江苏 南京 211106)
通讯作者: 李伟湋, E-mail: liweiwei@nuaa.edu.cn
摘 要: 跨项目软件缺陷预测技术可以利用现有的已标注缺陷数据集对新的无标记项目进行预测,但需要两者之
间具有相同的度量集合,难以用于实际开发.异构缺陷预测技术可以在具有异构度量集合的项目间进行缺陷预测,该
技术引起了大量研究人员的关注.现有的异构缺陷预测技术利用朴素的或者传统机器学习方法为源项目和目标项
目学习特征表示,所学习到的特征表示能力很弱且缺陷预测性能很差.鉴于深度神经网络强大的特征抽取和表示能
力,基于变分自编码器技术提出了一种面向异构缺陷预测的特征表示方法.该模型结合了变分自编码器和最大均值
差异距离,能够有效地学习源项目和目标项目的共性特征表示,基于该特征表示可以训练出有效的缺陷预测模型.在
多组缺陷数据集上通过与传统跨项目缺陷预测方法及异构缺陷预测方法实验对比验证了所提方法的有效性.
关键词: 异构缺陷预测;变分自编码器;特征表示
中图法分类号: TP311
中文引用格式: 贾修一,张文舟,李伟湋,黄志球.基于变分自编码器的异构缺陷预测特征表示方法.软件学报,2021,32(7):
2204–2218. http://www.jos.org.cn/1000-9825/6257.htm
英文引用格式: Jia XY, Zhang WZ, Li WW, Huang ZQ. Feature representation method for heterogeneous defect prediction based on
variational autoencoders. Ruan Jian Xue Bao/Journal of Software, 2021,32(7):22042218 (in Chinese). http://www.jos.org.cn/1000-
9825/6257.htm
Feature Representation Method for Heterogeneous Defect Prediction Based on Variational
Autoencoders
1
3
2
1
JIA Xiu-Yi , ZHANG Wen-Zhou , LI Wei-Wei , HUANG Zhi-Qiu
1 (School of Computer Science and Engineering, Nanjing University of Science and Technology, Nanjing 210094, China)
2 (College of Aerospace Engineering, Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China)
3 (College of Computer Science and Technology, Nanjing University of Aeronautics and Astronautics, Nanjing 211106, China)
Abstract: Cross-project defect prediction technology can use the existing labeled defect data to predict new unlabeled data, but it needs
to have the same metric features for two projects, which is difficult to be applied in actual development. Heterogeneous defect prediction
can perform prediction without requiring the source and target project to have the same set of metrics and thus has attracted great interest.
Existing heterogeneous defect prediction models use naive or traditional machine learning methods to learn feature representations
基金项目: 国家自然科学基金(61906090, U20B2064, 61773208); 江苏省自然科学基金(BK20191287, BK20170809); 中央高校
基本科研业务费专项资金(30920021131); 中国博士后科学基金(2018M632304)
Foundation item: National Natural Science Foundation of China (61906090, U20B2064, 61773208); Natural Science Foundation of
Jiangsu Province, China (BK20191287, BK20170809); Fundamental Research Funds for the Central Universities (30920021131); China
Postdoctoral Science Foundation (2018M632304)
本文由“面向非确定性的软件质量保障方法与技术”专题特约编辑陈俊洁副教授、汤恩义副教授、何啸副教授以及马晓星教授
推荐.
收稿时间: 2020-04-13; 修改时间: 2020-10-26; 采用时间: 2020-12-14; jos 在线出版时间: 2021-01-22