Page 185 - 《软件学报》2025年第10期
P. 185
4582 软件学报 2025 年第 36 卷第 10 期
IFA 指标上优于其他采样算法. 对于 AG-SZZ 模型, 除 IFA 指标之外, SMOTE 优于其他采样算法. 对于 MA-SZZ
模型, SMOTE 均优于其他采样算法. 而对于 RA-SZZ 模型, SMOTE 仅在 AUC 和 F-measure@20% 指标上优于其
他采样算法. 通过以上分析发现, 相比于其他采样算法, SMOTE 总体上表现最优. 因此, 在能够保留原始数据特征
的情况下, 本文建议未来的移动 APP 即时缺陷预测研究可使用 SMOTE 采样算法进行数据重平衡.
1% 1%
3% 3%
4% 4%
4% 4%
la, 19% la, 18%
5% 5%
5%
6%
entropy, 10% entropy, 10%
7% 7%
sexp, 10%
sexp, 10%
7% 7%
7% 8%
9% 9%
9% 8%
la entropy sexp nuc ld lt age la entropy sexp nuc ld lt ndev
ndev nf ns rexp fix exp nd age nf ns rexp fix exp nd
(a) B-SZZ (b) AG-SZZ
1% 1%
3% 3%
4% 3%
4% 3%
la, 18% 4% nuc, 19%
5%
5%
6%
6%
entropy, 10%
7% age, 14%
6%
sexp, 10%
7%
7%
la, 13%
8% 7%
9%
8% 9%
la entropy sexp nuc ld lt ndev nuc age la sexp lt entropy ld
age nf ns rexp fix exp nd ndev nf rexp fix ns exp nd
(c) MA-SZZ (d) RA-SZZ
图 10 类重平衡情况下所有项目中所有变更的 4 种 SZZ 模型的局部解释
5.0 7.0 7.0
5.2
3.8
5.2
Rankings 2.5 Rankings 3.5 Rankings 3.5
1.8
1.2
1.8
0 0 0
ROSE_B ROS_B ROSE_MA RUS_B ROS_AG ROSE_AG RUS_MA ROS_MA RUS_AG SMOTE_B SMOTE_MA SMOTE_AG RUS_RA ROSE_RA ROS_RA SMOTE_RA ROSE_MA ROSE_AG ROSE_B ROS_AG ROS_MA ROS_B RUS_B ROS_RA RUS_AG RUS_MA SMOTE_B ROSE_RA SMOTE_AG SMOTE_MA SMOTE_RA RUS_RA ROS_AG ROS_MA ROSE_AG ROSE_MA ROS_B ROS_RA ROSE_B RUS_AG SMOTE_RA RUS_MA SMOTE_MA SMOTE_B RUS_B SMOTE_AG ROSE_RA RUS_RA
(a) AUC (b) MCC (c) G-mean
图 11 4 种采样算法的对比结果

