Page 248 - 《软件学报》2025年第10期
P. 248

软件学报 ISSN 1000-9825, CODEN RUXUEW                                        E-mail: jos@iscas.ac.cn
                 2025,36(10):4645−4659 [doi: 10.13328/j.cnki.jos.007320] [CSTR: 32375.14.jos.007320]  http://www.jos.org.cn
                 ©中国科学院软件研究所版权所有.                                                          Tel: +86-10-62562563



                                                                 *
                 干扰惰性序列的连续决策模型模糊测试

                 吴泊逾  1 ,    王凯锐  1,2,3 ,    王亚文  1,2,3 ,    王俊杰  1,2,3


                 1
                  (中国科学院大学, 北京 100049)
                 2
                  (智能博弈重点实验室 (中国科学院 软件研究所), 北京 100190)
                 3
                  (中国科学院 软件研究所, 北京 100190)
                 通信作者: 王亚文, E-mail: yawen2018@iscas.ac.cn

                 摘 要: 人工智能技术的应用已经从分类、翻译、问答等相对静态的任务延伸到自动驾驶、机器人控制、博弈等
                 需要和环境进行一系列“交互-行动”才能完成的相对动态的任务. 执行这类任务的模型核心是连续决策算法, 由于
                 面临更高的环境和交互的不确定性, 而且这些任务往往是安全攸关的系统, 其测试技术面临极大的挑战. 现有的智
                 能算法模型测试技术主要集中在单一模型的可靠性、复杂任务多样性测试场景生成、仿真测试等方向, 对连续决
                 策模型的“交互-行动”决策序列没有关注, 导致无法适应, 或者成本效益低下. 提出一个干预惰性“交互-行动”决策
                 序列执行的模糊测试方法         IIFuzzing, 在模糊测试框架中, 通过学习“交互-行动”决策序列模式, 预测不会触发失效事
                 故的惰性“交互-行动”决策序列, 并中止这类序列的测试执行, 以提高测试效能. 在                      4  种常见的测试配置中进行实验
                 评估, 结果表明, 与最新的针对连续决策模型的模糊测试相比, IIFuzzing               可以在相同时间内多探测         16.7%–54.5%  的
                 失效事故, 并且事故的多样性也优于基线方法.
                 关键词: 连续决策模型; 马尔可夫决策过程; 模糊测试
                 中图法分类号: TP311

                 中文引用格式: 吴泊逾, 王凯锐, 王亚文, 王俊杰. 干扰惰性序列的连续决策模型模糊测试. 软件学报, 2025, 36(10): 4645–4659. http://
                 www.jos.org.cn/1000-9825/7320.htm
                 英文引用格式: Wu BY, Wang KR, Wang YW, Wang JJ. Fuzz Testing for Sequential Decision-making Model with Intervening Inert
                 Sequences. Ruan Jian Xue Bao/Journal of Software, 2025, 36(10): 4645–4659 (in Chinese). http://www.jos.org.cn/1000-9825/7320.htm

                 Fuzz Testing for Sequential Decision-making Model with Intervening Inert Sequences
                         1
                 WU Bo-Yu , WANG Kai-Rui 1,2,3 , WANG Ya-Wen 1,2,3 , WANG Jun-Jie 1,2,3
                 1
                 (University of Chinese Academy of Sciences, Beijing 100049, China)
                 2
                 (State Key Laboratory of Intelligent Game (Institute of Software, Chinese Academy of Sciences), Beijing 100190, China)
                 3
                 (Institute of Software, Chinese Academy of Sciences, Beijing 100190, China)
                 Abstract:  The  application  of  artificial  intelligence  technology  has  extended  from  relatively  static  tasks  such  as  classification,  translation,
                 and  question  answering  to  relatively  dynamic  tasks  that  require  a  series  of  “interaction-action”  with  the  environment  to  be  completed,  like
                 autonomous  driving,  robotic  control,  and  games.  The  core  of  the  model  for  executing  such  tasks  is  the  sequential  decision-making  (SDM)
                 algorithm.  As  it  faces  higher  uncertainties  of  the  environment  and  interaction  and  these  tasks  are  often  safety-critical  systems,  the  testing
                 techniques  are  confronted  with  great  challenges.  The  existing  testing  technologies  for  intelligent  algorithm  models  mainly  focus  on  the
                 reliability  of  a  single  model,  the  generation  of  diverse  test  scenarios  for  complex  tasks,  simulation  testing,  etc.,  while  no  attention  is  paid
                 to  the  “interaction-action”  decision  sequence  of  the  SDM  model,  leading  to  unadaptability  or  low  cost-effectiveness.  In  this  study,  a  fuzz
                 testing  method  named  IIFuzzing  for  intervening  in  the  execution  of  inert  “interaction-action”  decision  sequences  is  proposed.  In  the  fuzz
                 testing  framework,  by  learning  the  “interaction-action”  decision  sequence  pattern,  the  inert  “interaction-action”  decision  sequences  that  will


                 *    基金项目: 国家自然科学基金  (62232016, 62072442); 中国科学院青年创新促进会; 中国科学院软件研究所基础研究项目     (ISCAS-JCZD-
                  202304); 中国科学院软件研究所创新基金重大重点项目       (ISCAS-ZD-202302); 中国科学院软件研究所  2024  年度“创新团队” (2024-66)
                  收稿时间: 2024-06-04; 修改时间: 2024-08-07, 2024-09-24; 采用时间: 2024-10-28; jos 在线出版时间: 2025-03-26
                  CNKI 网络首发时间: 2025-03-27
   243   244   245   246   247   248   249   250   251   252   253