Page 193 - 《软件学报》2025年第10期
P. 193

软件学报 ISSN 1000-9825, CODEN RUXUEW                                        E-mail: jos@iscas.ac.cn
                 2025,36(10):4590−4611 [doi: 10.13328/j.cnki.jos.007309] [CSTR: 32375.14.jos.007309]  http://www.jos.org.cn
                 ©中国科学院软件研究所版权所有.                                                          Tel: +86-10-62562563



                                                                   *
                 基于抽象语法树变异的漏洞样本生成方法

                 郑    炜  1 ,    李云帆  1 ,    桂    奎  1 ,    吴潇雪  2 ,    陈    翔  3 ,    邓沛然  1


                 1
                  (西北工业大学 软件学院, 陕西 西安 710072)
                 2
                  (扬州大学 信息工程学院, 江苏 扬州 225127)
                 3
                  (南通大学 人工智能与计算机学院, 江苏 南通 226019)
                 通信作者: 吴潇雪, E-mail: xiaoxuewu@yzu.edu.cn

                 摘 要: 随着信息技术的持续发展, 软件产品的数量和种类不断增加, 然而即使是高质量的软件也可能存在漏洞.
                 此外, 软件更新速度快, 软件架构愈发复杂, 这导致漏洞逐渐进化成新的形态, 传统的漏洞检测方法和规则难以适
                 用于新的漏洞特征. 由于零日漏洞样本的稀缺性, 软件演化过程中出现的零日漏洞难以被发现, 这为软件安全带来
                 很大的潜在风险. 提出一种基于抽象语法树变异的漏洞样本生成方法, 能够模拟真实漏洞的结构和语法规则, 生成
                 更符合实际情况的漏洞样本, 它可以为软件安全性和可靠性提供更加有效的解决方案. 该方法通过分析 Eclipse
                 CDT 生成的抽象语法树结构, 提取节点中的语法信息, 重构节点和抽象语法树, 优化抽象语法树结构, 并设计一系
                 列变异算子, 然后在优化后的抽象语法树上进行变异操作. 该方法可以生成具有                         UAF  和  CUAF  漏洞特征的变异样
                 本, 这些样本可以用于零日漏洞的检测, 有助于提高零日漏洞的检测率. 实验结果表明, 该方法比传统检测方法中
                 的随机变异方法平均减少了 34% 的无效样本量, 并且可以生成更加复杂的变异样本; 此外, 该方法可以生成更加
                 复杂的变异样本, 提高检测的覆盖率和准确率.
                 关键词: 抽象语法树; 零日漏洞; 变异算子; 漏洞样本生成
                 中图法分类号: TP311

                 中文引用格式: 郑炜,  李云帆,  桂奎,  吴潇雪,  陈翔,  邓沛然.  基于抽象语法树变异的漏洞样本生成方法.  软件学报,  2025,  36(10):
                 4590–4611. http://www.jos.org.cn/1000-9825/7309.htm
                 英文引用格式: Zheng W, Li YF, Gui K, Wu XX, Chen X, Deng PR. Vulnerability Sample Generation Method Based on Abstract
                 Syntax Tree Variation. Ruan Jian Xue Bao/Journal of Software, 2025, 36(10): 4590–4611 (in Chinese). http://www.jos.org.cn/1000-
                 9825/7309.htm

                 Vulnerability Sample Generation Method Based on Abstract Syntax Tree Variation
                                                                   3
                                            1
                                                        2
                                    1
                          1
                 ZHENG Wei , LI Yun-Fan , GUI Kui , WU Xiao-Xue , CHEN Xiang , DENG Pei-Ran 1
                 1
                 (School of Software, Northwestern Polytechnical University, Xi’an 710072, China)
                 2
                 (School of Information Engineering, Yangzhou University, Yangzhou 225127, China)
                 3
                 (School of Artificial Intelligence and Computer Science, Nantong University, Nantong 226019, China)
                 Abstract:  With  the  continuous  development  of  information  technology,  the  quantity  and  variety  of  software  products  are  increasing,  but
                 even  high-quality  software  may  contain  vulnerabilities.  In  addition,  the  software  update  speed  is  fast,  and  the  software  architecture  is
                 increasingly  complex,  which  leads  to  the  gradual  evolution  of  vulnerabilities  into  new  forms.  Consequently,  traditional  vulnerability
                 detection methods and rules are difficult to apply to new vulnerability features. Due to the scarcity of zero-day vulnerability samples, zero-
                 day vulnerabilities that appear in the software evolution process are difficult to find, which brings great potential risks to software security.
                 This  study  proposes  a  vulnerability  sample  generation  method  based  on  abstract  syntax  tree  mutation,  which  can  simulate  the  structure  and


                 *    基金项目: 国家自然科学基金  (62141208); 陕西省重点研发计划  (2021GY-041)
                  收稿时间: 2023-04-04; 修改时间: 2023-08-01, 2024-05-29; 采用时间: 2024-10-28; jos 在线出版时间: 2025-05-07
                  CNKI 网络首发时间: 2025-05-08
   188   189   190   191   192   193   194   195   196   197   198