Page 208 - 《软件学报》2025年第7期

P. 208

张逍怡等: 面向智能体路径规划算法的动态随机测试方法 3129

多次执行生直觉上较优

成的路径的路径
200
180
160
140
120
100
80
60
40
20
0
0 20 40 60 80 100 120 140 160 180 200
图 7 测试过程中 DRT-PP 生成的失效度最大的测试用例及其生成路径

4 风险分析

根据文献 [54] 中对实验风险的论述, 对本研究结论的有效性构成威胁的因素包括 4 个方面: 构念有效性
(construct validity)、结论有效性 (conclusion validity)、内部有效性 (internal validity) 以及外部有效性 (external
validity). 本节从这 4 个方面来分析实验结论的有效性.
(1) 构念有效性. 由于路径规划算法的确认测试本身存在测试预期问题, 因此如何描述算法的性能需求并以此
为依据制定测试结果的评判准则就是一大挑战. 本文借助蜕变测试思想, 基于在相同测试用例下多次执行被测路
S (t), 并将其作为失效度. 然而不同的实
径规划算法所得到的路径差别不应很大这一启发式规则, 设计了度量准则
S (t) 值的需求可能不同, 因此我们很难将其与性能失效建立确切的联系. 为此, 本文通过 DRT-PP 方法试
际任务对
图找到尽可能大的 S (t). 此外, 我们在实验中分别对平均失效度、最大失效度以及失效度大于 40 的测试用例数量
200×200 的场景中同一测试用例的所生成的路径步长相差 40, 则该测试用例对分析算
进行了考察, 直觉上如果在
法稳定性及寻优性是有价值的. 今后我们会对规划时间等其他性能需求做进一步研究, 并制定相关的算法性能评
价准则. 此外, DRT-PP 方法还依赖于测试剖面的更新幅度 ε 为此我们在实验中通过 RQ3 分析了不同 ε 对测试结
果的影响.
(2) 结论有效性. 由于基于随机采样的 RRT 路径规划算法是非确定性的, 而本文提出的 DRT-PP 以及作为基
线方法的随机测试 RT 与自适应随机测试 ART 都带有随机性, 因此这些不确定性有可能会影响实验结果的有效
性. 首先, 本文的测试方法本身就是面向 RRT 随机采样所带来的稳定性问题; 其次, 针对 RT、ART 和 DRT-PP 的
不确定性, 我们对相关方法的各个配置都进行了多次重复实验, 并采用假设检验的方式对实验结果进行了分析. 今
后的研究中我们还会持续收集更多的数据并持续细化分析结果.
(3) 内部有效性. 本文实现了路径规划问题的基本场景、RRT 算法, 并在此基础上实现了 RT、ART 和 DRT-PP,
我们对代码进行了反复检验和测试, 以确认其正确性. 例如, 当出现无法达到目标点的情况时, 我们会对规划场景
进行反复检查, 以确认该现象由无效的测试用例所导致, 并排除了代码错误等问题.
(4) 外部有效性. 本文将目前路径规划系统通用的 RRT 算法作为被测对象, RRT 目前被广泛应用于各种路径
规划问题中 (如机械臂、智能物流等), 并被当作很多实际规划策略的基础. 并且, RRT 基于随机的采样, 其不依赖
于特定领域知识, 因此具备较强的普适性. 为了进一步检查外部有效性, 我们检查了 DRT-PP 在 RRT 算法不同参
数下的表现. 具体来说, 我们将 RRT 算法中生成随机树的最大孩子节点数设为 3 (记为 RRT3), 并在此配置下分别
运行 DRT-PP 和 RT (这里我们选取 DRT-15 配置). 结果显示, 各测试方法在 RRT 和 RRT3 上的表现差距不大. 当
被测算法由 RRT 替换为 RRT3 时, 对于 RT 来说, 平均失效度 S ( avg )、最大失效度 S ( max )、失效度大于 40 的个数
(>40) 分别从 6.5、37.7、0.0 变为 7.0、39.7、0.4, 表现略有提升; 而生成无效测试用例的个数二者持平 (均为

203 204 205 206 207 208 209 210 211 212 213