Page 193 - 《软件学报》2021年第11期
P. 193

黄立峰  等:一种基于进化策略和注意力机制的黑盒对抗攻击算法                                                  3519


















                                      Fig.3    Similarity of heatmaps between different models(%)
                                            图 3   不同模型生成热力图的相似度(%)
                    基于以上两个特性,本文提出的 AM-Com 方法主要包含 3 个步骤:(1)  基于替代模型生成热力图,近似估计
                 目标模型的关注区域;(2)  根据冗余扰动数据的区域性特征,按模型的关注程度对扰动进行分组;(3)  依次压缩
                 各组的扰动数值,直到所有分组的扰动数据完成优化步骤.流程如算法 2 所示.
                    算法 2.  基于注意力机制的对抗样本压缩优化方法.
                                                                      n
                    输入:目标网络模型 f,替代网络模型 f s ,初始扰动向量δ,图像 x∈R ,目标标签 y   ,优化系数 r 0 ,r max .
                    输出:优化后的对抗样本 x   ,扰动δ′.
                    1.   h s ←Normalize(CAM(f s ,x))  //生成热力图并归一化
                                      n
                                                                    n
                    2.   h←ReSample(h s ,R )      //将热力图重采样至 R 空间
                    3.   δ′←Group(δ,h,N)          //根据热力图对扰动分组
                    4.   for i=1 to N do
                    5.      s←r 0
                                  +
                    6.      while  f  (x δ′ =  )  y     do
                    7.         δ′[i]←s⋅δ′[i]      //压缩第 i 组扰动
                    8.         s←min(1.1×s,r max )  //调整优化系数
                    9.      end while
                    10.     δ′[i]←δ′[i]÷s
                    11. end for
                    12.  x ←+
                            x δ′

                    13. return δ′, x
                    算法 2 的具体描述如下.
                    (1)  热力图生成阶段(算法 2 中第 1 行、第 2 行).攻击者先基于替代模型 f s 计算输入图像 x 的归一化热力
                                                                                                  n
                        图 h s ,然后通过双线性插值方法将热力图重采样到目标模型的输入空间中,获得数据维度为 R 的热力
                        图 h,用于近似估计目标模型 f 对图像各区域的关注程度.
                    (2)  扰动分组阶段(算法 2 中第 3 行).该阶段根据热力图 h 将扰动δ进行像素级分组.首先将热力图的值域
                        平均划分为 N 个区间,再根据下标索引将扰动的像素与热力值一一对应,最后按照热力值的所属区间
                        范围将扰动的每一个像素分组至对应的集合.该扰动分组方法定义如下:
                                          ⎧        ⎛  i − 1 i ⎫ ⎪  ⎤  ⎪
                                     δ  [ ]i ′  =  δ  ∀ ⎨  , k h ∈  ⎜  ,  ⎥  , i = ⎬  1,2,3,..., ;N k =  1,2,3,...,n  (10)
                                          ⎪  k   k  ⎝  N  N ⎦  ⎪ ⎩  ⎭
                        其中,δ′[i]是热力值属于第 i 个区间的扰动像素的集合,k 是分配于第 i 组的像素下标.i 的值越大,意味
                        着目标模型对该组区域的关注程度越高.关于分组数量参数 N 的选择,本文将在第 3.3 节进行讨论.
                    (3)  冗余压缩阶段(算法 2 中第 4 行~第 11 行).AM-Com 方法按升序对分组后的扰动分别进行优化.对于
   188   189   190   191   192   193   194   195   196   197   198