Page 360 - 《软件学报》2024年第6期
P. 360

软件学报 ISSN 1000-9825, CODEN RUXUEW                                        E-mail: jos@iscas.ac.cn
                 Journal of Software,2024,35(6):2936−2950 [doi: 10.13328/j.cnki.jos.006928]  http://www.jos.org.cn
                 ©中国科学院软件研究所版权所有.                                                          Tel: +86-10-62562563



                                                                                   *
                 谛听: 面向鲁棒分布外样本检测的半监督对抗训练方法

                 周志阳  1,2 ,    窦文生  1,2,3 ,    李    硕  1,2 ,    亢良伊  1,2 ,    王    帅  1,2 ,    刘    杰  1,2,3,4 ,    叶    丹  1,2,3


                 1
                  (中国科学院 软件研究所, 北京 100190)
                 2
                  (中国科学院大学, 北京 100049)
                 3
                  (计算机科学国家重点实验室 (中国科学院 软件研究所), 北京 100190)
                 4
                  (中国科学院大学南京学院, 江苏 南京 211135)
                 通信作者: 刘杰, E-mail: ljie@otcaix.iscas.ac.cn; 叶丹, E-mail: yedan@otcaix.iscas.ac.cn
                 摘 要: 检测训练集分布之外的分布外             (out-of-distribution, OOD) 样本对于深度神经网络   (deep neural network,
                 DNN) 分类器在开放环境的部署至关重要. 检测             OOD  样本可以视为一种二分类问题, 即把输入样本分类为“分布
                 (Institute of Software, Chinese Academy of Sciences, Beijing 100190, China)
                 内  (in-distribution, ID)”类或“分布外”类. 进一步地, 检测器自身还可能遭受到恶意的对抗攻击而被再次绕过. 这些
                 带有恶意扰动的      OOD  样本称为对抗     OOD  样本. 构建鲁棒的    OOD  检测器以检测对抗       OOD  样本是一项更具挑战
                 性的任务. 为习得可分离且对恶意扰动鲁棒的表示, 现有方法往往利用辅助的干净                          OOD  样本邻域内的对抗       OOD
                 样本来训练    DNN. 然而, 由于辅助的     OOD  训练集与原    ID  训练集的分布差异, 训练对抗       OOD  样本无法足够有效地
                 使分布内决策边界对对抗扰动真正鲁棒. 从              ID  样本的邻域内生成的对抗        ID  样本拥有与原    ID  样本近乎一样的语
                 义信息, 是一种离分布内区域更近的           OOD  样本, 对提升分布内边界对对抗扰动的鲁棒性很有效. 基于此, 提出一种
                 半监督的对抗训练方法——谛听, 来构建鲁棒的               OOD  检测器, 用以同时检测干净        OOD  样本和对抗    OOD  样本. 谛
                 听将对抗    ID  样本视为一种辅助的“近       OOD”样本, 并将其与其他辅助的干净           OOD  样本和对抗    OOD  样本联合训
                 练  DNN, 以提升  OOD  检测的鲁棒性. 实验结果表明, 谛听在检测由强攻击生成的对抗                   OOD  样本上具有显著的优
                 势, 同时在原分类主任务及检测干净           OOD  样本上保持先进的性能.
                 关键词: 分布外样本检测; 对抗鲁棒性; 对抗训练
                 中图法分类号: TP18

                 中文引用格式: 周志阳, 窦文生, 李硕, 亢良伊, 王帅, 刘杰, 叶丹. 谛听: 面向鲁棒分布外样本检测的半监督对抗训练方法. 软件学
                 报, 2024, 35(6): 2936–2950. http://www.jos.org.cn/1000-9825/6928.htm
                 英文引用格式: Zhou ZY, Dou WS, Li S, Kang LY, Wang S, Liu J, Ye D. DiTing: Semi-supervised Adversarial Training Approach for
                 Robust Out-of-distribution Detection. Ruan Jian Xue Bao/Journal of Software, 2024, 35(6): 2936–2950 (in Chinese). http://www.jos.org.
                 cn/1000-9825/6928.htm

                 DiTing: Semi-supervised Adversarial Training Approach for Robust Out-of-distribution Detection
                                                                                1,2
                                                     1,2
                             1,2
                                                                    1,2
                 ZHOU Zhi-Yang , DOU Wen-Sheng 1,2,3 , LI Shuo , KANG Liang-Yi , WANG Shuai , LIU Jie 1,2,3,4 , YE Dan 1,2,3
                 1
                 2
                 (University of Chinese Academy of Sciences, Beijing 100049, China)
                 3
                 (State Key Laboratory of Computer Science (Institute of Software, Chinese Academy of Sciences), Beijing 100190, China)
                 4
                 (University of Chinese Academy of Sciences, Nanjing, Nanjing 211135, China)
                 Abstract:  Detecting  out-of-distribution  (OOD)  samples  outside  the  training  set  distribution  is  crucial  for  deploying  deep  neural  network
                 (DNN) classifiers in the open environment. OOD sample detection is a binary classification problem, which is to classify the input samples


                 *    基金项目: 国家自然科学基金  (61972386)
                  收稿时间: 2022-10-19; 修改时间: 2023-01-15; 采用时间: 2023-03-02; jos 在线出版时间: 2023-09-13
                  CNKI 网络首发时间: 2023-09-15
   355   356   357   358   359   360   361   362   363   364   365