Page 369 - 《软件学报》2025年第7期
P. 369

3290                                                       软件学报  2025  年第  36  卷第  7  期


                 它们受到触发器动态变化的影响, 当触发器位置不同时, 其防御效果会削弱.
                    整体上后门攻击与防御呈现出一场博弈, 目前尚不存在一种通用的后门防御方法. 单一的后门防御也无法完
                 全清除数据中的中毒样本. 因此, 将多种类型的后门防御相结合, 在一定程度上能够提高防御效果. 比如在剪枝防
                 御后运用   NC, 可以缩小搜索子空间大小, 提高触发器生成效率.

                 5   数据集与评价指标


                 5.1   数据集
                    (1) 计算机视觉常见数据集
                    本节整理了图像分类、目标检测、语义分割等视觉任务中后门攻击使用的数据集                              (具体见表   6). 据统计, 图
                 像分类任务中使用的基准数据集有            MNIST [131] 、CIFAR10/100 [132] 、ImageNet [133] 、GTSRB [134] . 人脸识别任务常用
                 数据集有   VGGFace [135] 、PubFig [136] 和  CelebA [137] . 除了常见的二维图像数据集外, 本文还列出了近几年后门攻击在
                 医学影像分割与分类任务、图像描述生成、三维点云分类及图结构等多模态任务中使用的数据集.
                    (2) 自然语言处理常见数据集
                    本节整理了文本分类、推断、问答、机器翻译等                  NLP  任务上后门攻击常用数据集          (具体可见表    7). 据统计,
                 文本分类任务中研究人员使用最多的数据集有                 IMDb [138] 、SST-2 [139] 和  Yelp [140] , 语义文本相似性任务使用较多的
                 数据集是   QQP, 问答任务使用较多的是        SQuAD [141] .

                                             表 6 计算机视觉后门攻击常用数据集

                    分类         任务            数据集         年份   类型    规模               相关研究
                                                                                 [22]   [30]  [68]  [67]
                                                                           BppAttack  , SGBA  , LIRA  , IAD  ,
                                                                             [26]    [59]    [88]     [79]
                                                                        WaNet  , Low-Pass  , FTrojan  , Hong等人  ,
                                                 [131]
                                            MNIST        1998  灰度    70k          [21]  [24]      [29]
                              手写数字                                          BadNets  , TDSC  , Zhong等人  ,
                   数字识别                                                   Salem等人 [66] , RobNet [69] , DIHBA [99] , LB [48]
                                           MultiMNIST    2018  灰度    -            Bagdasaryan等人 [85]
                              街景数字           SVHN        2011  彩色   0.6M    Hong等人 [79] , TBT [83] , BadEncoder [31]
                                                                           BppAttack [22] , SGBA [30] , LIRA [68] , IAD [67] ,
                                                                             WaNet [26] , WaveAttack [37] , CYO [58] ,
                                                                          FTrojan [88] , Low-Pass [59] , Hong等人 [79] , BTI-
                                                                         DFT/DCT [87] , IBA [60] , Zeng等人 [33] , DBIA [73] ,
                              物体分类        CIFAR10/100 [132]  2009  彩色  60k  Zhong等人 [29] , Lv等人 [74] , Xue等人 [70] ,
                                                                          DUBA [36] , LC [52] , Salem等人 [66] , RobNet [69] ,
                                                                          BadEncoder [31] , DIHBA [99] , Shafahi等人 [96] ,
                                                                         TBT [83] , Tan等人 [55] , Lin等人 [27] , AdvDoor [95] ,
                                                                           DFST [57] , HTBA [53] , Imperio [71] , TDSC [24]
                              服装分类       FashionMNIST [142]  2017  灰度  70k   Imperio [71] , Lv等人 [74] , DIHBA [99]
                              猫狗分类           Pets [143]  2012  彩色    -           Wei等人 [81] , DIHBA [99]
                   图像识别       花卉分类          Flowers [144]  2008  彩色  8k             Wei等人 [81]
                              物体分类         Caltech101 [145]  2004  彩色  9k           Wei等人 [81]
                              物体分类         Caltech256 [146]  2004  彩色  30k          Wei等人 [81]
                                                                             Refool [23] , WaveAttack [37] , CYO [58] ,
                                                                           TBT [83] , FTrojan [88] , Bagdasaryan等人 [85] ,
                                           ImageNet [133]  2009  彩色  14M  DBIA [73] , Tang等人 [78] , Lv等人 [74] , BA-DIC [75] ,
                                                                            ISSBA [98] , Invisible Poison [54] , SSL [86] ,
                              图像分类/                                          Shafahi等人 [96] , DFST [57] , HTBA [53]
                              目标检测
                                                   [133]                                 [86]
                                          ImageNet-100   2009  彩色    60k              SSL
                                          Tiny-ImageNet  2015  彩色   0.1M     LIRA [68] , Xue等人 [70] , Imperio [71]
                                                 [147]                             [60]       [31]
                                            STL-10       2011  彩色   0.1M         IBA  , BadEncoder
   364   365   366   367   368   369   370   371   372   373   374