Page 258 - 《软件学报》2024年第6期
P. 258

2834                                                       软件学报  2024  年第  35  卷第  6  期


                                     表 2    dSATNS  和  SATNS  两算法缺陷检测率的比较     (%)(续)

                                    N=4            N=6           N=10           N=50           N=100
                      FM
                               dSATNS  SATNS  dSATNS  SATNS  dSATNS  SATNS  dSATNS  SATNS  dSATNS  SATNS
                     csb281     49.49  49.33 ±  56.75  56.61 ±  65.14  65.12 ±  86.75  86.80 ±  92.24  92.20 ±
                    ecos-icse11  49.68  49.49 ±  56.75  56.78 ±  65.64  65.38 ±  86.76  86.70 ±  92.24  92.15 ±
                     ebsa285    48.90  48.98 ±  56.08  55.92 ±  64.62  64.43 ±  86.34  86.34 ±  91.95  91.88 ±
                     vrc4373    51.07  50.80 ±  58.07  58.08 ±  66.64  66.35 •  87.63  87.60 ±  92.81  92.86 ±
                      pati      50.96  50.81 ±  58.05  57.82 •  66.89  66.73 ±  87.60  87.56 ±  92.73  92.65 ±
                    dreamcast   50.77  50.63 ±  57.95  57.89 ±  66.57  66.83 ±  87.54  87.49 ±  92.71  92.70 ±
                    pc i82544   50.59  50.62 ±  57.69  57.71 ±  66.30  65.94 •  87.42  87.38 ±  92.60  92.53 ±
                    XSEngine    49.69  49.39 •  56.78  56.65 ±  65.54  65.38 ±  86.94  86.93 ±  92.35  92.41 ±
                    refidt334   50.27  50.05 ±  57.43  57.34 ±  65.91  65.63 •  87.00  86.79 •  92.21  92.20 ±
                     ocelot     51.08  51.09 ±  58.24  58.11 ±  66.51  66.51 ±  87.30  87.35 ±  92.56  92.51 •
                  integrator arm9  49.84  50.03 ±  57.04  56.77 •  65.34  65.22 ±  86.63  86.60 ±  92.01  91.94 ±
                    olpcl2294   49.99  50.14 ±  57.17  57.05 ±  65.90  65.77 ±  86.93  86.89 ±  92.29  92.19 •
                    olpce2294   50.39  50.34 ±  57.45  57.31 ±  66.14  66.04 ±  86.88  86.80 ±  92.17  92.17 ±
                     phycore.   50.63  50.75 ±  57.96  57.81 ±  66.38  66.11 ±  87.29  87.25 ±  92.60  92.55 ±
                    hs7729pci   50.24  50.35 ±  57.41  57.26 ±  65.89  65.83 ±  86.48  86.44 ±  91.88  91.78 •
                   freebsd-icse11  44.43  43.01 •  51.50  50.30 •  60.14  59.45 •  84.16  84.33 ◦  90.91  90.91 ±
                      fiasco    81.18  80.90 •  85.10  85.17 ±  89.77  89.77 ±  95.20  95.12 ±  96.29  96.41 ±
                     uClinux    87.98  86.17 •  92.23  91.40 •  96.01  95.67 •  99.79  99.78 ±  99.97  99.97 ±
                   Automotive01  44.13  44.06 ±  50.07  49.98 ±  57.02  57.19 ±  76.10  76.13 ±  82.40  82.32 ±
                  SPLOT-FM-5000  38.98  38.23 •  44.91  44.47 •  52.46  52.22 •  74.43  74.35 •  81.63  81.55 ±
                  busybox-1.18.0  81.36  79.84 •  86.55  85.58 •  91.84  91.37 •  98.86  98.81 •  99.61  99.61 ±
                   2.6.28.6-icse11  42.11  42.75 ◦  48.93  49.44 ◦  58.08  58.13 ±  82.05  82.11 ±  88.87  88.75 •
                   uClinux-config  80.07  78.31 •  85.23  84.16 •  90.87  90.48 •  98.58  98.56 ±  99.51  99.49 •
                    buildroot   72.84  72.82 ±  79.43  79.28 ±  85.27  85.32 ±  96.51  96.50 ±  98.20  98.16 •
                                •/◦/±  14/3/33  •/◦/±  12/2/36  •/◦/±  9/1/40  •/◦/±  6/1/43  •/◦/±  7/1/42
                 注: 粗体标注最优结果, •、◦、±分别表示第1个算法显著地优于、差于和等同于第2个算法

                                                   SATNS) 和持平情形 (即

                                         表 3    dSATNS  和  SATNS  的   ˆ A 12  比较结果汇总  (%)

                    覆盖率      N=4  N=6   N=10  N=50   N=100    缺陷检测率       N=4   N=6   N=10  N=50  N=100
                        ↑    28    32    14     0      0             ↑     16    16    12    4      4
                   l                                          l
                        ↓     2    2     0      4      2             ↓     2     2     0     0      0
                        ↑     6    8     12     4      2             ↑     10    4     6     6      10
                   m                                          m
                        ↓     2    0     6      2      2             ↓     0     0     2     2      2
                        ↑    22    42    26    14      8             ↑     20    30    34    24     22
                   s                                          s
                        ↓     4    2     2     14     22             ↓     12    4     10    2      10
                   n    ~    36    14    40    62     64      n      ~     40    44    36    62     52
                 注: ↑: dSATNS更优; ↓: SATNS更优, ~: 二者性能相当

                    根据  dSATNS  与  SATNS  的   ˆ A 12  比较结果, 若忽略效应量幅度, 可分  3  种情形: 改进情形 (即   dSATNS  表现优
                 于  SATNS), 退化情形 (即  dSATNS  表现差于                     dSATNS  与  SATNS  的表现相当). 将  l, m  和  s
                 这  3 种幅度所对应的百分数累加即可得到“改进情形”与“退化情形”所占的总的百分比, 而                       n 对应的百分数即为“持平
                 情形”所占的百分比. 图      3  以柱状图的形式给出了各种情形所占的百分比, 其中, ↑表示改进情形、↓表示退化情形、
                 ~表示持平情形. 如图       3(a) 所示, 就覆盖率而言: 当    N  小于等于  10  时, dSATNS“改进情形”的百分比明显高于“退
                 化情形”的百分比, 也高于“持平情形”的百分比; 当             N=50  和  100  时, 虽然“退化情形”的百分比高于“改进情形”, 但
                 是在绝大多数模型上       (62%+), 两算法的性能是持平的. 由图        3(b) 可知, 就缺陷检测率而言, 不论      N  取何值, “改进情
   253   254   255   256   257   258   259   260   261   262   263