Page 211 - 《软件学报》2020年第9期
P. 211
2832 Journal of Software 软件学报 Vol.31, No.9, September 2020
的应用需求.研究者们发现:除了文本相似度之外,软件中的其他特征也可以帮助定位缺陷.所以,这一
阶段的研究者们主要集中在挖掘软件项目中与缺陷有关的特有特征(例如项目版本历史、缺陷堆栈
等),并结合使用这些特征和 IR 模型来提升缺陷定位在测试项目上的性能;
(3) 进行查询重构.作为查询语句的缺陷报告是由不同的人员提交的,所以质量参差不齐.这些低质量的
查询导致很多 IRBL 模型表现较差,因而在 2013 年后出现一些研究者着重于对查询进行重构,以改善
现有 IRBL 模型的查询准确性;
(4) 应用深度学习.随着深度学习技术的发展,从 2017 年起,不少研究者开始尝试使用深度学习模型(如卷
积神经网络 CNN)对特征进行自动提取,然后结合信息检索技术对缺陷进行定位.
Fig.3 Overview of IR-based bug localization
图 3 基于信息检索的缺陷定位方法的模型改良趋势
Table 3 Summary of representative IR-based bug localization models
表 3 基于信息检索的缺陷定位代表性模型汇总
方法 定位 IR 使用特征
年份 引用
名称 级别 gg 模型 版本历史 相似报告 代码结构 堆栈踪迹 其他特征
LDA M LDA Lukins 等人 [34]
2010 LSI M LSI Nichols 等人 [33]
CLS F SVM ● Chen 等人 [85]
2011 BugScout F LDA ● Nguyen 等人 [49]
BugLocator F rVSM ● Zhou 等人 [28]
2012
TFIDF-DHbPd F DFR ● Sisman 等人 [60]
2013 BLUiR F Indri ● ● Saha 等人 [24]
Lobster Cl VSM ● ● Moreno 等人 [25]
VSMcomposite F VSM ● ● ● Wang 等人 [50]
2014 BRTracer F rVSM ● ● 文本分段 Wong 等人 [30]
AmaLgam F Mixed ● ● ● Wang 等人 [31]
LtR F VSM ● ● ● Ye 等人 [47]
2015 Rahman g F rVSM ● ● 文件名 Rahman 等人 [103]
BugCatcher F Lucene ● Kilinc 等人 [90]
AmaLgam+ F Mixed ● ● ● ● 报告者 Wang 等人 [80]
2016 [92]
MBuM M mVSM Rahman 等人
Locus F/Ch VSM ● ● Wen 等人 [32]