Page 248 - 《软件学报》2025年第10期
P. 248
软件学报 ISSN 1000-9825, CODEN RUXUEW E-mail: jos@iscas.ac.cn
2025,36(10):4645−4659 [doi: 10.13328/j.cnki.jos.007320] [CSTR: 32375.14.jos.007320] http://www.jos.org.cn
©中国科学院软件研究所版权所有. Tel: +86-10-62562563
*
干扰惰性序列的连续决策模型模糊测试
吴泊逾 1 , 王凯锐 1,2,3 , 王亚文 1,2,3 , 王俊杰 1,2,3
1
(中国科学院大学, 北京 100049)
2
(智能博弈重点实验室 (中国科学院 软件研究所), 北京 100190)
3
(中国科学院 软件研究所, 北京 100190)
通信作者: 王亚文, E-mail: yawen2018@iscas.ac.cn
摘 要: 人工智能技术的应用已经从分类、翻译、问答等相对静态的任务延伸到自动驾驶、机器人控制、博弈等
需要和环境进行一系列“交互-行动”才能完成的相对动态的任务. 执行这类任务的模型核心是连续决策算法, 由于
面临更高的环境和交互的不确定性, 而且这些任务往往是安全攸关的系统, 其测试技术面临极大的挑战. 现有的智
能算法模型测试技术主要集中在单一模型的可靠性、复杂任务多样性测试场景生成、仿真测试等方向, 对连续决
策模型的“交互-行动”决策序列没有关注, 导致无法适应, 或者成本效益低下. 提出一个干预惰性“交互-行动”决策
序列执行的模糊测试方法 IIFuzzing, 在模糊测试框架中, 通过学习“交互-行动”决策序列模式, 预测不会触发失效事
故的惰性“交互-行动”决策序列, 并中止这类序列的测试执行, 以提高测试效能. 在 4 种常见的测试配置中进行实验
评估, 结果表明, 与最新的针对连续决策模型的模糊测试相比, IIFuzzing 可以在相同时间内多探测 16.7%–54.5% 的
失效事故, 并且事故的多样性也优于基线方法.
关键词: 连续决策模型; 马尔可夫决策过程; 模糊测试
中图法分类号: TP311
中文引用格式: 吴泊逾, 王凯锐, 王亚文, 王俊杰. 干扰惰性序列的连续决策模型模糊测试. 软件学报, 2025, 36(10): 4645–4659. http://
www.jos.org.cn/1000-9825/7320.htm
英文引用格式: Wu BY, Wang KR, Wang YW, Wang JJ. Fuzz Testing for Sequential Decision-making Model with Intervening Inert
Sequences. Ruan Jian Xue Bao/Journal of Software, 2025, 36(10): 4645–4659 (in Chinese). http://www.jos.org.cn/1000-9825/7320.htm
Fuzz Testing for Sequential Decision-making Model with Intervening Inert Sequences
1
WU Bo-Yu , WANG Kai-Rui 1,2,3 , WANG Ya-Wen 1,2,3 , WANG Jun-Jie 1,2,3
1
(University of Chinese Academy of Sciences, Beijing 100049, China)
2
(State Key Laboratory of Intelligent Game (Institute of Software, Chinese Academy of Sciences), Beijing 100190, China)
3
(Institute of Software, Chinese Academy of Sciences, Beijing 100190, China)
Abstract: The application of artificial intelligence technology has extended from relatively static tasks such as classification, translation,
and question answering to relatively dynamic tasks that require a series of “interaction-action” with the environment to be completed, like
autonomous driving, robotic control, and games. The core of the model for executing such tasks is the sequential decision-making (SDM)
algorithm. As it faces higher uncertainties of the environment and interaction and these tasks are often safety-critical systems, the testing
techniques are confronted with great challenges. The existing testing technologies for intelligent algorithm models mainly focus on the
reliability of a single model, the generation of diverse test scenarios for complex tasks, simulation testing, etc., while no attention is paid
to the “interaction-action” decision sequence of the SDM model, leading to unadaptability or low cost-effectiveness. In this study, a fuzz
testing method named IIFuzzing for intervening in the execution of inert “interaction-action” decision sequences is proposed. In the fuzz
testing framework, by learning the “interaction-action” decision sequence pattern, the inert “interaction-action” decision sequences that will
* 基金项目: 国家自然科学基金 (62232016, 62072442); 中国科学院青年创新促进会; 中国科学院软件研究所基础研究项目 (ISCAS-JCZD-
202304); 中国科学院软件研究所创新基金重大重点项目 (ISCAS-ZD-202302); 中国科学院软件研究所 2024 年度“创新团队” (2024-66)
收稿时间: 2024-06-04; 修改时间: 2024-08-07, 2024-09-24; 采用时间: 2024-10-28; jos 在线出版时间: 2025-03-26
CNKI 网络首发时间: 2025-03-27

