Page 96 - 《软件学报》2026年第1期

P. 96

吉品等: 面向智能软件系统的测试用例生成方法综述 93

当前多模态测试用例生成方法主要关注于覆盖不同模态的组合状态, 但在生成多样化测试用例方面的研究仍
然存在不足. 未来的研究可以探索如何通过引入更多的变异算子来增加生成测试用例的多样性, 以更全面地覆盖
多模态数据的不同情况和特征. 其次, 多模态数据通常包含异构模态, 未来研究可以关注如何有效地生成针对异构
模态数据的测试用例, 这通常涉及如何处理和整合不同模态数据的特征表示、语义关联以及模态间的转换和映射
等问题. 此外, 多模态数据在各个领域得到广泛应用, 未来研究可以关注如何生成针对不同应用场景的多模态测试
用例, 以更好地模拟实际应用中的数据特征和需求, 提高测试用例的真实性.
9.2 面向智能软件系统的测试用例生成效率优化
目前, 许多智能软件系统测试方法把智能软件系统看成黑盒, 其中的测试用例生成方法属于数据驱动, 与模型
内部无关. 数据驱动测试将数据从逻辑脚本中分离出来, 并通过调整参数来更新测试数据以增加灵活性. 数据驱动
测试可以高效地构建测试数据集, 满足智能软件系统测试的大规模数据需求. 然而, 与生成的庞大测试数据集相
比, 真正能够捕获错误的测试用例比例较小, 导致大部分测试时间被消耗在运行未能揭示错误的测试用例上. 因
此, 如何在测试用例的生成过程中去引导生成能够较大概率揭示问题的测试用例, 或者基于测试用例的输入去预
测系统的行为, 将是提升智能软件测试效率的关键突破口.
经过观察与分析, 本文发现, 一些基于数据驱动的测试方法由于未利用系统核心模型的结构等内部特性, 难以
高效生成能够发现错误的测试用例, 从而降低了整体测试效率. 现有的一些灰盒测试方法结合了基于模型内部输
出的度量指标去对生成过程实现引导, 并取得了不错的效果提升. 从中可以看出, 结合模型内部输出或者结构特性
的测试方法是切实可行的, 研究者们可以在不同类型的智能软件上进行更多的尝试. 此外, 如何与提高模型行为可
解释性的相关技术有效结合, 以提升测试用例的生成效率, 也可能是提升智能软件测试用例生成方法效率的重要
切入点.
9.3 面向智能软件系统的测试用例生成迭代优化
当前在智能软件测试方法中, 错误行为被定义为错误的输出, 通常可被表示为代表输入输出的数据对, 具体的
表现形式与被测试的任务紧密相关. 当前的测试用例生成方法大多聚焦于如何找出智能软件系统的错误行为, 而
对如何利用捕获到的错误行为数据进行错误溯源、因果分析等反馈机制的研究较少. 这导致现有方法难以基于测
试用例的执行结果进行迭代优化, 在后续生成过程中也无法有针对性地产生高质量测试用例. 上述研究内容能够
最大化测试用例执行结果的利用率, 不仅能够提升智能软件测试的效果和效率, 对于后续的缺陷修复也能够提供
更多有价值的信息.
智能软件系统的错误溯源是指通过分析系统的错误行为来追溯和定位错误产生的原因和过程. 未来的研究可
以利用数据挖掘和机器学习等技术, 对测试用例捕获的错误日志等信息实施系统化分析与挖掘, 以发现错误产生
的模式和规律. 分类、聚类和关联规则算法等也可以用来分析错误行为的特征和属性, 以识别常见的错误类型和
错误相关因素. 基于错误溯源的结果, 测试用例生成方法可以在下一轮生成过程中, 产生与错误原因相对应的测试
用例以验证溯源结果, 或生成符合错误模式或规律的测试输入以捕获类似缺陷. 此外, 还可以设计具有不同特征和
属性的新测试输入, 以探索尚未覆盖的输入空间. 未来的研究还可以进一步地设计相应的系统质量改进措施, 包括
代码修复、数据清洗、模型调优等技术手段, 以改善智能软件系统的可靠性、稳定性和一致性.

10 总结

目前, 研究者们基于不同的技术路线提出了面向各类智能软件系统的测试用例生成方法, 以不断完善智能软
件系统的质量评价体系. 本文将智能软件系统按照人工智能技术的应用领域进行初步划分, 再按照系统实现的任
务目标进行归纳. 具体来说, 本文介绍了面向图像处理应用、自然语言处理应用、语音处理应用、点云处理应用、
多模态数据处理应用以及深度学习模型的各类测试用例生成方法, 形成全面详细的综述. 在此基础上, 本文进一步
讨论了当前面向智能软件系统的测试用例生成方法的不足之处以及未来的研究方向. 随着智能软件系统在众多领
域中的广泛应用, 它已成为当前工业界和学界重点关注的研究与应用焦点. 针对智能软件系统复杂的决策逻辑和

91 92 93 94 95 96 97 98 99 100 101