Page 179 - 《软件学报》2025年第10期
P. 179
4576 软件学报 2025 年第 36 卷第 10 期
对 B-SZZ、AG-SZZ 和 MA-SZZ 预测结果的影响程度最大. 这进一步表明 B-SZZ、AG-SZZ 和 MA-SZZ 对预测结
果的解释具有一致性, 相比 RA-SZZ 对预测结果的解释具有较低的一致性.
(4) 通过以上分析可以发现, la 度量元影响最大且倾向于对预测为有缺陷的贡献突出, 因此开发人员在提交代
码时, 对于添加行数较多的提交应该重点检查是否引入了缺陷.
High High
la la
sexp sexp
ld lt
entropy entropy
nuc ld
lt nuc
Feature value Feature value
ndev ndev
age age
nf nf
ns rexp
rexp ns
exp exp
fix fix
nd nd
Low Low
−0.4 −0.2 0 0.2 0.4 −0.4 −0.2 0 0.2 0.4
SHAP value (impact on model output) SHAP value (impact on model output)
(a) B-SZZ (b) AG-SZZ
High High
la nuc
sexp la
lt sexp
entropy age
nuc lt
ld ld
Feature value Feature value
ndev entropy
age ndev
nf rexp
ns nf
rexp exp
exp ns
fix fix
nd nd
Low Low
−0.4 −0.2 0 0.2 0.4 −0.4 −0.2 0 0.2 0.4 0.6
SHAP value (impact on model output) SHAP value (impact on model output)
(c) MA-SZZ (d) RA-SZZ
图 5 类不平衡情况下所有项目的 4 种 SZZ 模型的全局解释
在局部解释方面, 为了探究对不同 SZZ 算法标注的数据对某个变更预测结果的影响, 本文使用 SHAP 框架对
AntennaPod 项目中的 1 个变更 (Commit ID: eeeff6203) 进行解释分析. 图 6 展示了 SHAP 对 B-SZZ、AG-SZZ、

