Page 185 - 《软件学报》2025年第10期
P. 185

4582                                                      软件学报  2025  年第  36  卷第  10  期


                 IFA  指标上优于其他采样算法. 对于        AG-SZZ  模型, 除  IFA  指标之外, SMOTE  优于其他采样算法. 对于       MA-SZZ
                 模型, SMOTE  均优于其他采样算法. 而对于         RA-SZZ  模型, SMOTE  仅在  AUC  和  F-measure@20%  指标上优于其
                 他采样算法. 通过以上分析发现, 相比于其他采样算法, SMOTE                总体上表现最优. 因此, 在能够保留原始数据特征
                 的情况下, 本文建议未来的移动         APP  即时缺陷预测研究可使用         SMOTE  采样算法进行数据重平衡.


                                         1%                                   1%
                                       3%                                   3%
                                     4%                                  4%
                                  4%                                   4%
                                              la, 19%                              la, 18%
                                5%                                  5%
                              5%
                                                                  6%
                                               entropy, 10%                         entropy, 10%
                             7%                                   7%
                                                                                     sexp, 10%
                                                sexp, 10%
                              7%                                   7%
                                  7%                                    8%
                                              9%                                   9%
                                        9%                                   8%
                              la  entropy  sexp  nuc  ld  lt  age  la  entropy  sexp  nuc  ld  lt  ndev
                              ndev  nf  ns  rexp  fix  exp  nd     age  nf  ns  rexp  fix  exp  nd
                                       (a) B-SZZ                           (b) AG-SZZ
                                         1%                                   1%
                                       3%                                   3%
                                    4%                                    3%
                                  4%                                   3%
                                              la, 18%                4%           nuc, 19%
                               5%
                                                                   5%
                             6%
                                                                 6%
                                               entropy, 10%
                            7%                                                        age, 14%
                                                                  6%
                                                sexp, 10%
                              7%
                                                                   7%
                                                                                   la, 13%
                                  8%                                   7%
                                              9%
                                        8%                                   9%
                              la  entropy  sexp  nuc  ld  lt  ndev  nuc  age  la  sexp  lt  entropy  ld
                              age  nf  ns  rexp  fix  exp  nd     ndev  nf  rexp  fix  ns  exp  nd
                                      (c) MA-SZZ                           (d) RA-SZZ
                                图 10 类重平衡情况下所有项目中所有变更的               4  种  SZZ  模型的局部解释


                   5.0                           7.0                           7.0
                                                                               5.2
                   3.8
                                                 5.2
                  Rankings  2.5                 Rankings  3.5                 Rankings  3.5
                                                                               1.8
                   1.2
                                                 1.8
                    0                             0                             0
                     ROSE_B  ROS_B ROSE_MA  RUS_B ROS_AG ROSE_AG RUS_MA ROS_MA RUS_AG SMOTE_B SMOTE_MA SMOTE_AG RUS_RA ROSE_RA ROS_RA SMOTE_RA  ROSE_MA ROSE_AG ROSE_B ROS_AG ROS_MA  ROS_B  RUS_B ROS_RA RUS_AG RUS_MA SMOTE_B ROSE_RA SMOTE_AG SMOTE_MA SMOTE_RA RUS_RA  ROS_AG ROS_MA ROSE_AG ROSE_MA  ROS_B ROS_RA ROSE_B RUS_AG SMOTE_RA RUS_MA SMOTE_MA SMOTE_B  RUS_B SMOTE_AG ROSE_RA RUS_RA

                               (a) AUC                      (b) MCC                       (c) G-mean
                                                图 11 4  种采样算法的对比结果
   180   181   182   183   184   185   186   187   188   189   190