Page 183 - 《软件学报》2025年第10期
P. 183

4580                                                      软件学报  2025  年第  36  卷第  10  期


                    (3) 通过以上分析发现, 在类重平衡情况下, B-SZZ、AG-SZZ、MA-SZZ              与  RA-SZZ  在局部解释方面不太一
                 致, 其中  la 度量元对模型的预测结果有重要影响且都对预测为有缺陷的贡献大.


                                                       High                                    High
                          la                                      la
                       entropy                                 entropy
                        sexp                                    sexp
                         nuc                                     nuc
                          ld                                      ld
                          lt                                      lt
                                                          Feature value                            Feature value
                         age                                    ndev
                        ndev                                     age
                          nf                                      nf
                          ns                                      ns
                        rexp                                    rexp
                         fix                                     fix
                         exp                                     exp
                          nd                                      nd
                                                       Low                                     Low
                               −0.4  −0.2  0  0.2  0.4                 −0.4  −0.2  0  0.2  0.4
                             SHAP value (impact on model output)     SHAP value (impact on model output)
                                      (a) B-SZZ                               (b) AG-SZZ
                                                       High                                    High
                          la                                     nuc
                      entropy                                    age
                        sexp                                      la
                         nuc                                    sexp
                          ld                                      lt
                          lt                                   entropy
                        ndev                              Feature value  ld                        Feature value
                         age                                    ndev
                          nf                                      nf
                          ns                                    rexp
                        rexp                                     fix
                         fix                                      ns
                         exp                                     exp
                         nd                                       nd
                                                       Low                                     Low
                                −0.4  −0.2  0  0.2  0.4                 −0.4  −0.2  0  0.2  0.4
                             SHAP value (impact on model output)     SHAP value (impact on model output)
                                      (c) MA-SZZ                             (d) RA-SZZ
                                       图 8 类重平衡后所有项目的         4  种  SZZ  模型的全局解释

                    图  10  展示了在类重平衡情况下所有项目中所有变更的                4  种  SZZ  模型的局部解释结果占比. 从图      10  中可以
                 看出, 对于  B-SZZ  模型, 影响程度最大的      3  个度量元为   la (19%)、entropy (10%) 和  sexp (10%), 对于  AG-SZZ  和
                 MA-SZZ  模型, 影响程度最大的      3  个度量元为   la (18%)、entropy (10%) 和  lt (10%), 而对于  RA-SZZ  模型, 影响程
                 度最大的   3  个度量元是   nuc (19%)、age (14%) 和  la (13%). 这表明, 在所有项目的所有变更中, 局部解释结果与全
   178   179   180   181   182   183   184   185   186   187   188