Page 188 - 《软件学报》2024年第6期
P. 188
2764 软件学报 2024 年第 35 卷第 6 期
0.5 0.5
Avg Avg
Sum Sum
0.4 0.4
0.3 0.3
M 1 M 1
0.2 0.2
0.1 0.1
0 0
1 2 3 1 2 3
物体数量 物体数量
(e) 基于真实图像的物体替换策略 (α=7°) (f) 基于真实图像的物体替换策略 (α=9°)
图 9 不同策略和参数生成测试数据误导能力对比 (续)
不同的参数设置和策略生成的测试数据数量并不相同, 这是因为有的参数设置和策略将无法从部分原始图像
中选出足够的待替换物体. 例如设置替换物体数量为 3, 而原始图像内的可供选择的物体数量小于 3. 其中, 使用真
实物体替换策略、设置替换物体数量为 3, 使用总贡献度方式计算物体贡献度的参数和策略设置所生成测试数据
最少, 为 2 475 张图像.
由图 9 中可以看出, 在只改变单一因素而其他策略和参数设置相同的情况下, 实验结果都遵循了以下的现象.
(1) 使用基于真实图像的物体替换策略, 比使用基于图像翻译的物体替换策略的误导成功率更高.
(2) 使用物体总贡献度选择待替换物体, 比使用物体平均贡献度误导成功率更高.
(3) 替换物体数量越多, 误导成功率越高.
从真实图像中提取的物体通常和待替换物体的轮廓形状存在一定差异, 而图像翻译工具生成的物体与待替换
物体的轮廓完全相同, 所以真实物体与待替换物体的差异性更大, 能更有效地误导模型, 从而导致产生现象 (1). 使
用物体总贡献计算贡献度的方法选择待替换物体的策略所选择的物体, 其在面积上通常比使用物体平均贡献计算
贡献度的策略所选择的物体更大, 所以物体替换后与原始图像的差异更大, 能更有效地误导模型, 从而导致产生现
象 (2). 相似地, 替换物体数量越多, 则物体替换后与原始图像的差异越大, 能更有效地误导模型, 从而导致产生现
象 (3).
不同参数和策略设置的 LPIPS 值对比实验结果如后文图 10 所示. 其中, 纵轴为 LPIPS 值, 横轴为替换物体数
量. 图 10(a) 为使用基于图像翻译的物体替换策略, 图 10(b) 为使用基于真实图像的物体替换策略. 如图 10 所示,
IATG 在不同策略和参数设置下生成的测试数据除了少量个例以外, LPIPS 值均小于 0.05 (LPIPS 的值域为 [0, 1),
越接近 0 则表示测试数据越接近原始真实图像). 说明 IATG 在以上策略和参数设置下均能生成真实性较高的测
试数据. 其中, 替换物体数量越少, 真实性越高; 根据物体平均贡献度选择待替换物体的策略, 比使用物体总贡献度
的真实性高; 使用基于图像翻译的物体替换策略, 比使用基于真实图像的物体替换策略更加接近原始真实图像.
针对 RQ1 的结论: 将替换物体数量设置为 3 个, 使用物体总贡献度计算贡献度的方法选择待替换物体, 并使
用真实物体进行替换的策略将得到误导能力最强的测试数据集. 将替换物体数量设置为 1 个, 使用 物体平均贡献
度计算贡献度的方法选择待替换物体, 并使用基于图像翻译的物体替换策略将得到更接近 真实图像的测试数
据集.
3.5 RQ2 实验结果分析
为了研究使用解释方法选择被替换物体对 IATG 的影响, 使用 IATG 方法和随机选择被替换物体的方法进
行对比实验. 其中, 随机选择被替换物体的方法为 IATG 的基础上, 使用随机选择的方法替换基于解释分析选择
被替换物体的方法 (以下称为 IATG rand ). 基于第 3.4 节的实验结论, 使用了以下两种参数设置和策略作为被比较