Page 369 - 《软件学报》2025年第7期
P. 369
3290 软件学报 2025 年第 36 卷第 7 期
它们受到触发器动态变化的影响, 当触发器位置不同时, 其防御效果会削弱.
整体上后门攻击与防御呈现出一场博弈, 目前尚不存在一种通用的后门防御方法. 单一的后门防御也无法完
全清除数据中的中毒样本. 因此, 将多种类型的后门防御相结合, 在一定程度上能够提高防御效果. 比如在剪枝防
御后运用 NC, 可以缩小搜索子空间大小, 提高触发器生成效率.
5 数据集与评价指标
5.1 数据集
(1) 计算机视觉常见数据集
本节整理了图像分类、目标检测、语义分割等视觉任务中后门攻击使用的数据集 (具体见表 6). 据统计, 图
像分类任务中使用的基准数据集有 MNIST [131] 、CIFAR10/100 [132] 、ImageNet [133] 、GTSRB [134] . 人脸识别任务常用
数据集有 VGGFace [135] 、PubFig [136] 和 CelebA [137] . 除了常见的二维图像数据集外, 本文还列出了近几年后门攻击在
医学影像分割与分类任务、图像描述生成、三维点云分类及图结构等多模态任务中使用的数据集.
(2) 自然语言处理常见数据集
本节整理了文本分类、推断、问答、机器翻译等 NLP 任务上后门攻击常用数据集 (具体可见表 7). 据统计,
文本分类任务中研究人员使用最多的数据集有 IMDb [138] 、SST-2 [139] 和 Yelp [140] , 语义文本相似性任务使用较多的
数据集是 QQP, 问答任务使用较多的是 SQuAD [141] .
表 6 计算机视觉后门攻击常用数据集
分类 任务 数据集 年份 类型 规模 相关研究
[22] [30] [68] [67]
BppAttack , SGBA , LIRA , IAD ,
[26] [59] [88] [79]
WaNet , Low-Pass , FTrojan , Hong等人 ,
[131]
MNIST 1998 灰度 70k [21] [24] [29]
手写数字 BadNets , TDSC , Zhong等人 ,
数字识别 Salem等人 [66] , RobNet [69] , DIHBA [99] , LB [48]
MultiMNIST 2018 灰度 - Bagdasaryan等人 [85]
街景数字 SVHN 2011 彩色 0.6M Hong等人 [79] , TBT [83] , BadEncoder [31]
BppAttack [22] , SGBA [30] , LIRA [68] , IAD [67] ,
WaNet [26] , WaveAttack [37] , CYO [58] ,
FTrojan [88] , Low-Pass [59] , Hong等人 [79] , BTI-
DFT/DCT [87] , IBA [60] , Zeng等人 [33] , DBIA [73] ,
物体分类 CIFAR10/100 [132] 2009 彩色 60k Zhong等人 [29] , Lv等人 [74] , Xue等人 [70] ,
DUBA [36] , LC [52] , Salem等人 [66] , RobNet [69] ,
BadEncoder [31] , DIHBA [99] , Shafahi等人 [96] ,
TBT [83] , Tan等人 [55] , Lin等人 [27] , AdvDoor [95] ,
DFST [57] , HTBA [53] , Imperio [71] , TDSC [24]
服装分类 FashionMNIST [142] 2017 灰度 70k Imperio [71] , Lv等人 [74] , DIHBA [99]
猫狗分类 Pets [143] 2012 彩色 - Wei等人 [81] , DIHBA [99]
图像识别 花卉分类 Flowers [144] 2008 彩色 8k Wei等人 [81]
物体分类 Caltech101 [145] 2004 彩色 9k Wei等人 [81]
物体分类 Caltech256 [146] 2004 彩色 30k Wei等人 [81]
Refool [23] , WaveAttack [37] , CYO [58] ,
TBT [83] , FTrojan [88] , Bagdasaryan等人 [85] ,
ImageNet [133] 2009 彩色 14M DBIA [73] , Tang等人 [78] , Lv等人 [74] , BA-DIC [75] ,
ISSBA [98] , Invisible Poison [54] , SSL [86] ,
图像分类/ Shafahi等人 [96] , DFST [57] , HTBA [53]
目标检测
[133] [86]
ImageNet-100 2009 彩色 60k SSL
Tiny-ImageNet 2015 彩色 0.1M LIRA [68] , Xue等人 [70] , Imperio [71]
[147] [60] [31]
STL-10 2011 彩色 0.1M IBA , BadEncoder

