Page 183 - 《软件学报》2025年第10期
P. 183
4580 软件学报 2025 年第 36 卷第 10 期
(3) 通过以上分析发现, 在类重平衡情况下, B-SZZ、AG-SZZ、MA-SZZ 与 RA-SZZ 在局部解释方面不太一
致, 其中 la 度量元对模型的预测结果有重要影响且都对预测为有缺陷的贡献大.
High High
la la
entropy entropy
sexp sexp
nuc nuc
ld ld
lt lt
Feature value Feature value
age ndev
ndev age
nf nf
ns ns
rexp rexp
fix fix
exp exp
nd nd
Low Low
−0.4 −0.2 0 0.2 0.4 −0.4 −0.2 0 0.2 0.4
SHAP value (impact on model output) SHAP value (impact on model output)
(a) B-SZZ (b) AG-SZZ
High High
la nuc
entropy age
sexp la
nuc sexp
ld lt
lt entropy
ndev Feature value ld Feature value
age ndev
nf nf
ns rexp
rexp fix
fix ns
exp exp
nd nd
Low Low
−0.4 −0.2 0 0.2 0.4 −0.4 −0.2 0 0.2 0.4
SHAP value (impact on model output) SHAP value (impact on model output)
(c) MA-SZZ (d) RA-SZZ
图 8 类重平衡后所有项目的 4 种 SZZ 模型的全局解释
图 10 展示了在类重平衡情况下所有项目中所有变更的 4 种 SZZ 模型的局部解释结果占比. 从图 10 中可以
看出, 对于 B-SZZ 模型, 影响程度最大的 3 个度量元为 la (19%)、entropy (10%) 和 sexp (10%), 对于 AG-SZZ 和
MA-SZZ 模型, 影响程度最大的 3 个度量元为 la (18%)、entropy (10%) 和 lt (10%), 而对于 RA-SZZ 模型, 影响程
度最大的 3 个度量元是 nuc (19%)、age (14%) 和 la (13%). 这表明, 在所有项目的所有变更中, 局部解释结果与全

