Page 175 - 《软件学报》2025年第10期
P. 175

4572                                                      软件学报  2025  年第  36  卷第  10  期



                        6.0                                     6.0
                        4.5                                     4.5
                       Ranking  3.0                             Ranking  3.0

                        1.5                                     1.5
                         0                                       0
                         NB_MA NB_AG NB_RA LR_MA LR_AG LR_B  NB_B LR_RA RF_B RF_AG RF_MA RF_RA  NB_AG NB_MA NB_RA NB_B LR_AG LR_MA  LR_B LR_RA  RF_B RF_MA RF_AG RF_RA

                                       (a) AUC                                  (b) MCC
                        6.0                                     6.0
                        4.5                                     4.5
                       Ranking  3.0                             Ranking  3.0

                        1.5                                     1.5
                         0                                       0
                         NB_MA NB_AG NB_RA NB_B LR_RA LR_AG LR_MA LR_B RF_RA RF_B RF_MA RF_AG  NB_B LR_AG LR_B  RF_B NB_MA LR_MA NB_RA RF_MA NB_AG LR_RA RF_AG RF_RA

                                       (c) G-mean                           (d) F-measure@20%
                                           6.0
                                           4.5
                                           Ranking  3.0
                                           1.5
                                            0
                                             RF_RA RF_MA RF_AG RF_B LR_MA NB_RA LR_RA LR_B LR_AG NB_MA NB_AG NB_B


                                                           (e) IFA
                                     图 3 类不平衡情况下       4  种  SZZ  算法的  SKESD  统计测试结果

                    (1) B-SZZ: 在传统指标方面, 观察到      B  模型相对于   RA  模型在  AUC  方面的得分占比为      95%–97%, 平均占比
                 为  99%, 仅在朴素贝叶斯分类器上优于         RA  模型. 在  MCC  指标上, B  模型的得分相对于     RA  模型为  90%–157%, 平
                 均占比为   113%, 仅在朴素贝叶斯分类器上优于           RA  模型. 此外, 在  G-mean  指标上, B  模型的得分相对于     RA  模型
                 为  98%–109%, 平均占比为   104%, 仅逻辑回归分类器上低于        RA  模型.
                    在工作量感知指标方面, 发现          B  模型相对于   RA  模型在  F-measure@20%  方面的得分为   87%–90%, 平均占比
                 为  90%, 在所有分类器上不如      RA  模型. 在  IFA  方面, B  模型相对于  RA  模型的得分为    100%–150%, 平均占比为
                 117%, 仅在随机森林分类器上优于         RA  模型.
                    (2) AG-SZZ: 在传统指标方面, AG     模型的   AUC  得分相对于   RA  模型的得分占比为      95%–100%, 平均占比为
                 98%, 仅在朴素贝叶斯分类器上与          RA  模型相当. 在   MCC  方面, AG  模型的得分相对于      RA  模型的得分为     90%–
                 114%, 平均占比为    100%, 仅在朴素贝叶斯分类器上与         RA  模型相当. 此外, 对于    G-mean  指标而言, AG  模型的得
                 分相对于   RA  模型的得分占比为      97%–105%, 平均占比为    100%, 仅在逻辑回归分类器上低于         RA  模型.
                    在工作量感知指标方面, 对于         F-measure@20%  而言, AG  模型相对于   RA  模型的得分为    93%–100%, 平均占比
                 为  97%, 仅在朴素贝叶斯分类器上与         RA  模型一致. 在  IFA  方面, AG  模型相对于   RA  模型的得分为    100%, 与  RA
                 模型基本一致.
                    (3) MA-SZZ: 在传统指标方面, 观察到      MA  模型相对于    RA  模型的  AUC  得分占比为    95%–100%, 平均占比为
                 98%. 值得注意的是, 仅在随机森林分类器上显著低于              RA  模型. 此外, 在  MCC  方面, MA  模型相对于   RA  模型的得
                 分为  93%–114%, 平均占比为    101%, 仅在朴素贝叶斯分类器上优于          RA  模型. 在  G-mean  指标方面, MA  模型相对
                 于  RA  模型的得分占比为     98%–105%, 平均占比为    101%, 仅在逻辑回归分类器上低于         RA  模型.
   170   171   172   173   174   175   176   177   178   179   180