Page 175 - 《软件学报》2025年第10期
P. 175
4572 软件学报 2025 年第 36 卷第 10 期
6.0 6.0
4.5 4.5
Ranking 3.0 Ranking 3.0
1.5 1.5
0 0
NB_MA NB_AG NB_RA LR_MA LR_AG LR_B NB_B LR_RA RF_B RF_AG RF_MA RF_RA NB_AG NB_MA NB_RA NB_B LR_AG LR_MA LR_B LR_RA RF_B RF_MA RF_AG RF_RA
(a) AUC (b) MCC
6.0 6.0
4.5 4.5
Ranking 3.0 Ranking 3.0
1.5 1.5
0 0
NB_MA NB_AG NB_RA NB_B LR_RA LR_AG LR_MA LR_B RF_RA RF_B RF_MA RF_AG NB_B LR_AG LR_B RF_B NB_MA LR_MA NB_RA RF_MA NB_AG LR_RA RF_AG RF_RA
(c) G-mean (d) F-measure@20%
6.0
4.5
Ranking 3.0
1.5
0
RF_RA RF_MA RF_AG RF_B LR_MA NB_RA LR_RA LR_B LR_AG NB_MA NB_AG NB_B
(e) IFA
图 3 类不平衡情况下 4 种 SZZ 算法的 SKESD 统计测试结果
(1) B-SZZ: 在传统指标方面, 观察到 B 模型相对于 RA 模型在 AUC 方面的得分占比为 95%–97%, 平均占比
为 99%, 仅在朴素贝叶斯分类器上优于 RA 模型. 在 MCC 指标上, B 模型的得分相对于 RA 模型为 90%–157%, 平
均占比为 113%, 仅在朴素贝叶斯分类器上优于 RA 模型. 此外, 在 G-mean 指标上, B 模型的得分相对于 RA 模型
为 98%–109%, 平均占比为 104%, 仅逻辑回归分类器上低于 RA 模型.
在工作量感知指标方面, 发现 B 模型相对于 RA 模型在 F-measure@20% 方面的得分为 87%–90%, 平均占比
为 90%, 在所有分类器上不如 RA 模型. 在 IFA 方面, B 模型相对于 RA 模型的得分为 100%–150%, 平均占比为
117%, 仅在随机森林分类器上优于 RA 模型.
(2) AG-SZZ: 在传统指标方面, AG 模型的 AUC 得分相对于 RA 模型的得分占比为 95%–100%, 平均占比为
98%, 仅在朴素贝叶斯分类器上与 RA 模型相当. 在 MCC 方面, AG 模型的得分相对于 RA 模型的得分为 90%–
114%, 平均占比为 100%, 仅在朴素贝叶斯分类器上与 RA 模型相当. 此外, 对于 G-mean 指标而言, AG 模型的得
分相对于 RA 模型的得分占比为 97%–105%, 平均占比为 100%, 仅在逻辑回归分类器上低于 RA 模型.
在工作量感知指标方面, 对于 F-measure@20% 而言, AG 模型相对于 RA 模型的得分为 93%–100%, 平均占比
为 97%, 仅在朴素贝叶斯分类器上与 RA 模型一致. 在 IFA 方面, AG 模型相对于 RA 模型的得分为 100%, 与 RA
模型基本一致.
(3) MA-SZZ: 在传统指标方面, 观察到 MA 模型相对于 RA 模型的 AUC 得分占比为 95%–100%, 平均占比为
98%. 值得注意的是, 仅在随机森林分类器上显著低于 RA 模型. 此外, 在 MCC 方面, MA 模型相对于 RA 模型的得
分为 93%–114%, 平均占比为 101%, 仅在朴素贝叶斯分类器上优于 RA 模型. 在 G-mean 指标方面, MA 模型相对
于 RA 模型的得分占比为 98%–105%, 平均占比为 101%, 仅在逻辑回归分类器上低于 RA 模型.

