Page 55 - 《软件学报》2025年第4期
P. 55

软件学报 ISSN 1000-9825, CODEN RUXUEW                                        E-mail: jos@iscas.ac.cn
                 2025,36(4):1461−1488 [doi: 10.13328/j.cnki.jos.007254] [CSTR: 32375.14.jos.007254]  http://www.jos.org.cn
                 ©中国科学院软件研究所版权所有.                                                          Tel: +86-10-62562563



                                             *
                 深度代码模型安全综述

                 孙伟松  1,2 ,    陈宇琛  1,2 ,    赵梓含  1,2 ,    陈    宏  1,2 ,    葛一飞  1,2 ,    韩廷旭  1,2 ,    黄胜寒  1,2 ,    李佳讯  3 ,    房春荣  1,2 ,
                 陈振宇  1,2


                 1
                  (计算机软件新技术国家重点实验室 (南京大学), 江苏 南京 210093)
                 2
                  (南京大学 软件学院, 江苏 南京 210093)
                 3
                  (苏州大学 数学科学学院, 江苏 苏州 215006)
                 通信作者: 房春荣, E-mail: fangchunrong@nju.edu.cn

                 摘 要: 随着深度学习技术在计算机视觉与自然语言处理等领域取得巨大成功, 软件工程研究者开始尝试将其引
                 入到软件工程任务求解当中. 已有研究结果显示, 深度学习技术在各种代码相关任务                           (例如代码检索与代码摘要)
                 (Software Institute, Nanjing University, Nanjing 210093, China)
                 上具有传统方法与机器学习方法无法比拟的优势. 这些面向代码相关任务训练的深度学习模型统称为深度代码模
                 型. 然而, 由于神经网络的脆弱性和不可解释性, 与自然语言处理模型与图像处理模型一样, 深度代码模型安全也
                 面临众多挑战, 已经成为软件工程领域的焦点. 近年来, 研究者提出了众多针对深度代码模型的攻击与防御方法.
                 然而, 目前仍缺乏对深度代码模型安全研究的系统性综述, 不利于后续研究者对该领域进行快速的了解. 因此, 为
                 了总结该领域研究现状、挑战及时跟进该领域的最新研究成果, 搜集                       32  篇该领域相关论文, 并将现有的研究成果
                 主要分为后门攻击与防御技术和对抗攻击与防御技术两类. 按照不同技术类别对所收集的论文进行系统地梳理和
                 总结. 随后, 总结该领域中常用的实验数据集和评估指标. 最后, 分析该领域所面临的关键挑战以及未来可行的研
                 究方向, 旨在为后续研究者进一步推动深度代码模型安全的发展提供有益指导.
                 关键词: 深度代码模型; 深度代码模型安全; 人工智能模型安全; 后门攻击与防御; 对抗攻击与防御
                 中图法分类号: TP311

                 中文引用格式: 孙伟松, 陈宇琛, 赵梓含, 陈宏, 葛一飞, 韩廷旭, 黄胜寒, 李佳讯, 房春荣, 陈振宇. 深度代码模型安全综述. 软件学
                 报, 2025, 36(4): 1461–1488. http://www.jos.org.cn/1000-9825/7254.htm
                 英文引用格式: Sun WS, Chen YC, Zhao ZH, Chen H, Ge YF, Han TX, Huang SH, Li JX, Fang CR, Chen ZY. Survey on Security of
                 Deep Code Models. Ruan Jian Xue Bao/Journal of Software, 2025, 36(4): 1461–1488 (in Chinese).  http://www.jos.org.cn/1000-9825/
                 7254.htm

                 Survey on Security of Deep Code Models
                            1,2
                                                       1,2
                                                                             1,2
                                                                   1,2
                                          1,2
                                                                                          1,2
                 SUN Wei-Song , CHEN Yu-Chen , ZHAO Zi-Han , CHEN Hong , GE Yi-Fei , HAN Ting-Xu ,
                                          3
                                                         1,2
                                1,2
                 HUANG Sheng-Han , LI Jia-Xun , FANG Chun-Rong , CHEN Zhen-Yu 1,2
                 1
                 (State Key Laboratory for Novel Software Technology (Nanjing University), Nanjing 210093, China)
                 2
                 3
                 (School of Mathematical Sciences, Soochow University, Suzhou 215006, China)
                 Abstract:  With  the  significant  success  of  deep  learning  in  fields  such  as  computer  vision  and  natural  language  processing,  researchers  in
                 software  engineering  have  begun  to  explore  its  integration  into  solving  software  engineering  tasks.  Existing  research  indicates  that  deep
                 learning  exhibits  advantages  in  various  code-related  tasks,  such  as  code  retrieval  and  code  summarization,  that  traditional  methods  and
                 machine  learning  cannot  match.  Deep  learning  models  trained  for  code-related  tasks  are  referred  to  as  deep  code  models.  However,  similar


                 *    基金项目: 国家自然科学基金  (61932012, 62372228)
                  收稿时间: 2023-12-18; 修改时间: 2024-02-12, 2024-05-06; 采用时间: 2024-07-05; jos 在线出版时间: 2024-12-09
                  CNKI 网络首发时间: 2024-12-10
   50   51   52   53   54   55   56   57   58   59   60