Page 179 - 《软件学报》2025年第10期
P. 179

4576                                                      软件学报  2025  年第  36  卷第  10  期


                 对  B-SZZ、AG-SZZ  和  MA-SZZ  预测结果的影响程度最大. 这进一步表明          B-SZZ、AG-SZZ  和  MA-SZZ  对预测结
                 果的解释具有一致性, 相比        RA-SZZ  对预测结果的解释具有较低的一致性.
                    (4) 通过以上分析可以发现, la 度量元影响最大且倾向于对预测为有缺陷的贡献突出, 因此开发人员在提交代
                 码时, 对于添加行数较多的提交应该重点检查是否引入了缺陷.


                                                     High                                       High
                        la                                          la
                       sexp                                       sexp
                        ld                                          lt
                     entropy                                    entropy
                       nuc                                          ld
                        lt                                         nuc
                                                        Feature value                               Feature value
                      ndev                                        ndev
                       age                                         age
                        nf                                         nf
                        ns                                        rexp
                       rexp                                        ns
                       exp                                         exp
                        fix                                        fix
                        nd                                         nd
                                                     Low                                        Low
                              −0.4 −0.2  0  0.2  0.4                     −0.4 −0.2  0  0.2  0.4
                            SHAP value (impact on model output)        SHAP value (impact on model output)
                                    (a) B-SZZ                                 (b) AG-SZZ
                                                      High                                       High
                         la                                        nuc
                       sexp                                         la
                         lt                                        sexp
                      entropy                                      age
                        nuc                                         lt
                         ld                                         ld
                                                         Feature value                              Feature value
                       ndev                                      entropy
                        age                                       ndev
                         nf                                        rexp
                         ns                                         nf
                        rexp                                       exp
                        exp                                         ns
                         fix                                        fix
                         nd                                         nd
                                                      Low                                        Low
                               −0.4 −0.2  0  0.2  0.4                    −0.4 −0.2  0  0.2  0.4  0.6
                            SHAP value (impact on model output)         SHAP value (impact on model output)
                                   (c) MA-SZZ                                 (d) RA-SZZ
                                     图 5 类不平衡情况下所有项目的           4  种  SZZ  模型的全局解释

                    在局部解释方面, 为了探究对不同           SZZ  算法标注的数据对某个变更预测结果的影响, 本文使用                 SHAP  框架对
                 AntennaPod  项目中的  1  个变更  (Commit ID: eeeff6203) 进行解释分析. 图  6  展示了  SHAP  对  B-SZZ、AG-SZZ、
   174   175   176   177   178   179   180   181   182   183   184