Page 73 - 《软件学报》2026年第1期

P. 73

70 软件学报 2026 年第 37 卷第 1 期

有的图像中引入扰动. 该框架由 3 个主要模块组成: 图像生成器、采样方法和可视化工具. 图像生成器通过排列基
本对象 (如道路背景、车辆), 调整亮度、对比度与饱和度等图像参数, 并保留物体纵横比, 从而渲染生成真实道路
场景图像. 基于主动优化的采样方法能够均匀地覆盖修改空间, 目标是为图像生成器提供修改点以生成能够被错
误分类的图片, 可视化工具根据设定的指标提供测试结果. 与之类似, MetaOD [53] 首先收集了许多按类别区分的对
象集, 并基于设定标准, 从与背景图像相关的对象集中筛选对象实例. 图像合成阶段, MetaOD 使用受 delta 调试启
发的领域特定标准和技术来找到可能触发预测错误的位置, 并将对象插入.
此外, 还有的研究者着重评估自动驾驶系统中的感知模块对于其他交通参与者的检测性能, 重点关注被插入
参与者对被测对象的影响. 例如, Shao [54] 提出的一种通过对真实图像中车辆进行三维重建来生成测试用例的方法.
该方法首先确定一个被插入的对象以及一个背景图像, 随后对背景图像进行三维建模, 并采用启发式方法完成对
象插入与图像合成. 该启发式方法使得边框和目标分割所得的物体之间不产生任何重叠. 与其他工作不同的是, 该
方法会根据输入的图像重现插入车辆的三维模型. 三维重建由边界估计和消失点估计两部分组成, 前者是为了识
别每个物体的边界, 后者是为了识别所有车辆和其他物体的视角.
与插入对象不同的是, 移除对象的测试生成策略需要考虑如何填充被移除对象对应的空缺位置, 同时需要保
证生成图像的语义正确, 即对剩余对象的语义不产生影响. 例如, Wang 等人 [55] 所提出的方法通过从给定的原始图
像中移除对象来构造测试输入, 再通过比较对象移除前后的目标检测结果来判断被测对象是否出现检测错误. 该
方法从图像中获取到可被移除的对象的位置和类别信息等, 并使用随机像素噪声填充被移除对象的位置. 随机像
素噪声并不会对图片中的其他语义成分产生影响, 极大地降低了该方法的误报率.
3.3 现有方法优缺点分析
随着近年来自动驾驶技术的快速发展, 面向图像处理应用的测试用例生成方法亦受到广泛关注. 然而, 经总结
分析, 本文发现现有方法存在以下问题与局限性: (1) 应用场景的局限性: 现有方法主要聚焦于自动驾驶系统的视
觉感知模块, 通过生成或变异输入图像模拟驾驶场景中的复杂情况. 然而, 当这些方法应用于其他类型的被测对象
时, 其有效性还有待考证. 这一局限性主要源于现有方法在测试用例生成过程中对领域特定知识的高度依赖, 缺乏
跨领域适配的通用性与灵活性. (2) 测试输入真实性的不足: 部分方法通过调整整体图像参数以尽量降低变异对关
键对象的影响; 另一些方法则采用拼接或组合真实图像的方式生成接近真实世界的新图像. 然而, 多数方法未对生
成图像的有效性进行人工审核, 测试用例的真实性及不同图像变换方法对误报率的影响仍有待进一步验证与研
究. 如表 2 所示, 本文结合各技术路径进行了更为详细的优缺点分析.

表 2 现有面向图像处理应用的技术路径优缺点总结

技术路径优点缺点
(1) 利用神经元激活状态引导输入生成过程, 提升模型内部行 (1) 依赖于被测对象内部模型的结构信息,
基于神经网络内为覆盖率, 以便更全面发现模型在不同输入特征下的潜在缺陷限制在白盒测试场景下使用
部行为的覆盖 (2) 不依赖具体语义标签, 即从被测对象的行为特征出发进行 (2) 神经元行为通常缺乏可解释性, 限制了
分析
输入空间划分, 提升测试用例生成的引导性和覆盖性测试结果的直观性和可用性
(1) 变异策略丰富, 易于实施, 可生成多样化的测试输入去模拟
基于图像输入特现实应用环境 (1) 难以系统性覆盖高阶语义或边界性场景
征的变异生成 (2) 图像真实性要求限制了变异操作自由度
(2) 无需了解被测对象的模型内部结构, 适用于多种黑盒系统
(1) 测试生成质量高度依赖场景建模的准确
基于场景特性的 (1) 具备更强的上下文建模能力, 可用于复杂的测试场景当中性, 领域知识存在偏差易引发误判
领域知识驱动 (2) 有效提升测试用例的合理性与有效性, 减少误报率 (2) 变异能力受限于知识库的覆盖范围, 容
变异
易导致测试盲区, 难以触发缺陷
基于神经元行为能基于神经元行为与输出间的关系, 构建有针对性的测试预言, (1) 依赖神经元输出模式, 泛化能力有限
分析的测试预言有助于发现特定类别的错误 (2) 神经元行为与输出结果之间的因果关系
构建难以验证
(1) 语义差异判断标准难以统一, 常需依赖
基于图像语义的 (1) 更易于人类理解, 适合高层语义的验证人为设定的阈值
测试预言构建 (2) 不依赖被测对象的内部结构信息, 可用于黑盒测试 (2) 语义提取通常依赖外部模型, 可能引入
误差干扰

68 69 70 71 72 73 74 75 76 77 78