Page 125 - 《软件学报》2025年第9期
P. 125
软件学报 ISSN 1000-9825, CODEN RUXUEW E-mail: jos@iscas.ac.cn
2025,36(9):4036−4055 [doi: 10.13328/j.cnki.jos.007267] [CSTR: 32375.14.jos.007267] http://www.jos.org.cn
©中国科学院软件研究所版权所有. Tel: +86-10-62562563
*
基于多模态融合的软件缺陷协同分派方法
谢生龙 1,2,3 , 李青山 1,3 , 歹 杰 1,3 , 崔 笛 1,3
1
(西安电子科技大学 计算机科学与技术学院, 陕西 西安 710126)
2
(延安大学 数学与计算机科学学院, 陕西 延安 716000)
3
(西安市智能软件工程重点实验室 (西安电子科技大学), 陕西 西安 710126)
通信作者: 李青山, E-mail: qshli@mail.xidian.edu.cn
摘 要: 软件缺陷 (bug) 分派是将 bug 报告与适合解决该 bug 的开发人员进行匹配的过程, 能够使 bug 得到及时修
复. 目前的 bug 分派研究大多集中于 bug 报告的文本分类, 但根据帕累托法则, 用以分类的 bug 报告存在数据分布
不均衡现象, 容易对非活跃开发者产生较差的分派效果; 此外, 现有的分类模型忽视了对开发人员的建模且难以挖
掘 bug 与开发人员之间的相关性, 影响了 bug 分派效能. 为此, 提出一种基于多模态融合的软件缺陷协同分派方法
CBT-MF (collaborative bug triaging method based on multimodal fusion). 该方法首先对 bug 报告进行预处理并构造
bug-开发人员二部图; 其次, 为了缓减 bug 修复记录分布不均衡性的影响, 通过 K-means 和正负采样的方法对二部
图数据进行增强; 为了表征开发者信息, 基于图卷积模型提取二部图节点特征; 最后, 采用内积匹配的方法捕获
bug 与开发者的相关性, 并通过贝叶斯个性化排序实现 bug 报告与开发人员的推荐与分派. 在公开数据集上进行全
面的实验评估, 实验结果表明, CBT-MF 在 bug 分派方面相较于多个现有先进方法表现出更优越的性能.
关键词: 缺陷分派; 不均衡性; 多模态融合; 图卷积
中图法分类号: TP311
中文引用格式: 谢生龙, 李青山, 歹杰, 崔笛. 基于多模态融合的软件缺陷协同分派方法. 软件学报, 2025, 36(9): 4036–4055. http://
www.jos.org.cn/1000-9825/7267.htm
英文引用格式: Xie SL, Li QS, Dai J, Cui D. Collaborative Bug Triaging Method Based on Multimodal Fusion. Ruan Jian Xue
Bao/Journal of Software, 2025, 36(9): 4036–4055 (in Chinese). http://www.jos.org.cn/1000-9825/7267.htm
Collaborative Bug Triaging Method Based on Multimodal Fusion
1,3
1,3
XIE Sheng-Long 1,2,3 , LI Qing-Shan , DAI Jie , CUI Di 1,3
1
(School of Computer Science and Technology, Xidian University, Xi’an 710126, China)
2
(College of Mathematics and Computer Science, Yan’an University, Yan’an 716000, China)
3
(Xi’an Key Laboratory of Intelligent Software Engineering (Xidian University), Xi’an 710126, China)
Abstract: Bug triaging is the process of assigning bug reports to developers suitable for resolving the reported bugs, ensuring timely fixes.
Current research in bug triaging mainly focuses on the text classification of bug reports. However, according to the Pareto principle, the
data distribution of bug reports used for classification is unbalanced, which may lead to ineffective triaging for inactive developers.
Additionally, existing classification models often neglect to model developers and struggle to capture the correlations between bugs and
developers, affecting the efficiency of bug triaging. To address these issues, this study proposes a collaborative bug triaging method based
on multimodal fusion (CBT-MF). This method first preprocesses bug reports and constructs a bug-developer bipartite graph. To mitigate
the impact of the unbalanced distribution of bug fix records, the bipartite graph data is enhanced using K-means clustering and positive-
negative sampling. To represent developer information, node features are extracted from the bipartite graph using a graph convolutional
* 基金项目: 国家自然科学基金 (U21B2015, 62202357); 陕西省自然科学基础研究计划 (2023-JC-QN-0744); 陕西省科协青年人才托举计
划 (20220113); 西安电子科技大学杭州研究院概念验证基金 (XJ2023230039)
收稿时间: 2023-10-25; 修改时间: 2024-01-09, 2024-05-30; 采用时间: 2024-08-04; jos 在线出版时间: 2025-01-24
CNKI 网络首发时间: 2025-01-26

