Page 205 - 《软件学报》2025年第7期
P. 205

3126                                                       软件学报  2025  年第  36  卷第  7  期


                 ART5, 但除了  DRT10  与  ART5  的比较结果外, 其余结果不显著; DRT-15      略逊于   ART, 但比较结果不是很显著. 将
                 来我们会用更多实验数据对其进行比较.

                                     表 2 RQ1  不同  DRT-PP  配置与  RT  的对比的假设检验结果

                     准则             DRT-05             DRT-10            DRT-15             DRT-20
                     S  avg       (40.36, 0.00, √)  (15.81, 0.00, √)   (14.61, 0.00, √)   (22.11, 0.00, √)
                     S  max       (1.84, 0.09, ≡)    (4.52, 0.00, √)    (3.91, 0.00, √)   (3.37, 0.00, √)

                                    表 3 RQ1  不同  DRT-PP  配置与  ART3  的对比的假设检验结果

                     准则             DRT-05             DRT-10            DRT-15             DRT-20
                     S avg        (39.26, 0.00, √)  (15.45, 0.00, √)   (14.26, 0.00, √)   (21.55, 0.00, √)
                     S  max      (−0.52, 0.61, ≡)    (1.39, 0.18, ≡)    (2.31, 0.04, √)   (0.39, 0.70, ≡)

                                    表 4 RQ1  不同  DRT-PP  配置与  ART5  的对比的假设检验结果

                     准则             DRT-05             DRT-10            DRT-15             DRT-20
                     S avg        (39.51, 0.00, √)  (15.54, 0.00, √)   (14.35, 0.00, √)   (21.69, 0.00, √)
                     S  max      (−0.11, 0.92, ≡)    (2.25, 0.04, √)    (2.77, 0.02, √)   (1.05, 0.31, ≡)

                    图  6  展示了  DRT-PP (包含  DRT-05、DRT-10、DRT-15、DRT-20)、ART (包含   ART3、ART5) 与  RT  在执行
                 过程中生成测试用例的失效度变化过程, 其中, 横坐标表示生成并执行的测试用例数量, 纵坐标表示失效度                                  S (t).
                 为了便于观测, 我们将曲线进行了平滑处理              (浅色曲线为实际曲线). 从图中可以看出, 由于            RT  采用了纯随机策略,
                 其生成测试用例的失效度始终在一个比较低的值附近摆动; 而                     ART  尽管试图通过增大随机采样的分散程度来提
                 升测试用例的多样性, 但由于路径规划场景空间非常复杂, 因此无论是                      ART3  还是  ART5, ART  失效度的变化都
                 与  RT  类似, 始终在较低的值周围摆动; DRT-PP       算法得到的失效度尽管也有剧烈摆动, 但由于其考虑了路径规划
                 的领域知识, 设计了基于测试剖面更新的寻优策略, 随着测试的进行, 其失效度平均值会逐渐增大.


                                               RT   DRT-10  DRT-20  ART3   ART5
                                               DRT-05  DRT-15
                                            30
                                            25
                                            20
                                           S (t)  15
                                            10

                                             5
                                             0
                                              0    200   400    600   800   1 000
                                                        Size of test cases
                                      图 6 DRT-PP  与  RT  和  ART  在测试过程中失效度的变化

                    RQ1  结论: 实验结果表明, 动态随机测试         (DRT-PP) 方法在面向智能体路径规划算法的测试中优于随机测试
                 (RT) 以及自适应随机测试       (包括  ART3  和  ART5). 具体来说, DRT-PP  能够生成具有较高平均失效度的测试用例
                 集, 能够发现更多具有高失效度的测试用例, 并且能够生成较少的无效测试用例. 此外, 随着测试的进行, DRT-PP
                 的测试剖面确实能够逐渐趋近于生成能够暴露潜在失效的测试用例.

                 3.3.2    多样性分析
                    表  5  展示了利用公式    (27) 对  RT、ART  和  DRT-PP  生成测试用例的多样性的评估结果. 可以看出, 若不计算
   200   201   202   203   204   205   206   207   208   209   210