Page 360 - 《软件学报》2024年第6期
P. 360
软件学报 ISSN 1000-9825, CODEN RUXUEW E-mail: jos@iscas.ac.cn
Journal of Software,2024,35(6):2936−2950 [doi: 10.13328/j.cnki.jos.006928] http://www.jos.org.cn
©中国科学院软件研究所版权所有. Tel: +86-10-62562563
*
谛听: 面向鲁棒分布外样本检测的半监督对抗训练方法
周志阳 1,2 , 窦文生 1,2,3 , 李 硕 1,2 , 亢良伊 1,2 , 王 帅 1,2 , 刘 杰 1,2,3,4 , 叶 丹 1,2,3
1
(中国科学院 软件研究所, 北京 100190)
2
(中国科学院大学, 北京 100049)
3
(计算机科学国家重点实验室 (中国科学院 软件研究所), 北京 100190)
4
(中国科学院大学南京学院, 江苏 南京 211135)
通信作者: 刘杰, E-mail: ljie@otcaix.iscas.ac.cn; 叶丹, E-mail: yedan@otcaix.iscas.ac.cn
摘 要: 检测训练集分布之外的分布外 (out-of-distribution, OOD) 样本对于深度神经网络 (deep neural network,
DNN) 分类器在开放环境的部署至关重要. 检测 OOD 样本可以视为一种二分类问题, 即把输入样本分类为“分布
(Institute of Software, Chinese Academy of Sciences, Beijing 100190, China)
内 (in-distribution, ID)”类或“分布外”类. 进一步地, 检测器自身还可能遭受到恶意的对抗攻击而被再次绕过. 这些
带有恶意扰动的 OOD 样本称为对抗 OOD 样本. 构建鲁棒的 OOD 检测器以检测对抗 OOD 样本是一项更具挑战
性的任务. 为习得可分离且对恶意扰动鲁棒的表示, 现有方法往往利用辅助的干净 OOD 样本邻域内的对抗 OOD
样本来训练 DNN. 然而, 由于辅助的 OOD 训练集与原 ID 训练集的分布差异, 训练对抗 OOD 样本无法足够有效地
使分布内决策边界对对抗扰动真正鲁棒. 从 ID 样本的邻域内生成的对抗 ID 样本拥有与原 ID 样本近乎一样的语
义信息, 是一种离分布内区域更近的 OOD 样本, 对提升分布内边界对对抗扰动的鲁棒性很有效. 基于此, 提出一种
半监督的对抗训练方法——谛听, 来构建鲁棒的 OOD 检测器, 用以同时检测干净 OOD 样本和对抗 OOD 样本. 谛
听将对抗 ID 样本视为一种辅助的“近 OOD”样本, 并将其与其他辅助的干净 OOD 样本和对抗 OOD 样本联合训
练 DNN, 以提升 OOD 检测的鲁棒性. 实验结果表明, 谛听在检测由强攻击生成的对抗 OOD 样本上具有显著的优
势, 同时在原分类主任务及检测干净 OOD 样本上保持先进的性能.
关键词: 分布外样本检测; 对抗鲁棒性; 对抗训练
中图法分类号: TP18
中文引用格式: 周志阳, 窦文生, 李硕, 亢良伊, 王帅, 刘杰, 叶丹. 谛听: 面向鲁棒分布外样本检测的半监督对抗训练方法. 软件学
报, 2024, 35(6): 2936–2950. http://www.jos.org.cn/1000-9825/6928.htm
英文引用格式: Zhou ZY, Dou WS, Li S, Kang LY, Wang S, Liu J, Ye D. DiTing: Semi-supervised Adversarial Training Approach for
Robust Out-of-distribution Detection. Ruan Jian Xue Bao/Journal of Software, 2024, 35(6): 2936–2950 (in Chinese). http://www.jos.org.
cn/1000-9825/6928.htm
DiTing: Semi-supervised Adversarial Training Approach for Robust Out-of-distribution Detection
1,2
1,2
1,2
1,2
ZHOU Zhi-Yang , DOU Wen-Sheng 1,2,3 , LI Shuo , KANG Liang-Yi , WANG Shuai , LIU Jie 1,2,3,4 , YE Dan 1,2,3
1
2
(University of Chinese Academy of Sciences, Beijing 100049, China)
3
(State Key Laboratory of Computer Science (Institute of Software, Chinese Academy of Sciences), Beijing 100190, China)
4
(University of Chinese Academy of Sciences, Nanjing, Nanjing 211135, China)
Abstract: Detecting out-of-distribution (OOD) samples outside the training set distribution is crucial for deploying deep neural network
(DNN) classifiers in the open environment. OOD sample detection is a binary classification problem, which is to classify the input samples
* 基金项目: 国家自然科学基金 (61972386)
收稿时间: 2022-10-19; 修改时间: 2023-01-15; 采用时间: 2023-03-02; jos 在线出版时间: 2023-09-13
CNKI 网络首发时间: 2023-09-15