Page 137 - 《软件学报》2025年第9期
P. 137
4048 软件学报 2025 年第 36 卷第 9 期
于 CBT-G.
通过对比表 3 中的 CBT-P 和 CBT-G 可以发现, CBT-P 的各项评估指标略低于 CBT-G, 这说明即使 CBT-G
存在数据不均衡性问题的情况下, 两个模态数据的融合也能在一定程度上缓解 bug 报告文本数据模态单一对 bug-
开发者相关性欠表征带来的影响, 这充分说明将两种模态数据融合分析可以对 CBT-MF 的 bug 分派性能提升产
生积极的作用.
此外, 为了评估同一数据集不同程度修复记录关联分布不均衡性对 CBT-MF 性能的影响, 实验根据表 1 所示
的修复记录数, 将 GC、MC、MF 这 3 个数据集中的所有 bug 报告记录和开发人员依次分成 G1–G5 这 5 个数据
组, 保持每一组中的 bug 修复记录数和开发人员数量不变. 其中, 较小 ID 的数据组, 包含的 bug 报告较新, 需要修
复的时间跨度大, 且数据组的 bug 报告记录规模大、数量多; 相同的 bug 修复记录数的条件下, 相对于其他同等数
量开发者的大 ID 数据组来讲, 数据不均衡的可能性更大. 例如, 与大 ID 组相比, 在相同修复记录、相同开发人员
数量下, 包含较多修复记录的 G1 表示在数据组中开发人员修复的 bug 相对较少, 意味着数据组的修复记录关联
分布不均衡性更强. 各数据组仍然以 8:1:1 的比例分为训练集、验证集及测试集, 并与整体性能较优的 SGL 方法
比较 Recall@20 和 Hit@20 指标, 最终在测试集上的实验统计结果如图 3 所示.
SGL CBT-MF SGL CBT-MF SGL CBT-MF
0.030
0.016 0.007
0.028
0.006
0.014
Recall@20 0.012 Recall@20 0.005 Recall@20 0.026
0.004
0.024
0.010 0.003
0.022
0.002
0.008 0.020
G1 G2 G3 G4 G5 G1 G2 G3 G4 G5 G1 G2 G3 G4 G5
(a) GC 数据组-Recall (b) MC 数据组-Recall (c) MF 数据组-Recall
SGL CBT-MF SGL CBT-MF SGL CBT-MF
0.12 0.16
0.35
0.10 0.14
0.30
Hit@20 0.08 Hit@20 0.12 Hit@20 0.25
0.06
0.10
0.20
0.04
0.08
0.15
G1 G2 G3 G4 G5 G1 G2 G3 G4 G5 G1 G2 G3 G4 G5
(d) GC 数据组-Hit (e) MC 数据组-Hit (f) MF 数据组-Hit
图 3 CBT-MF 不同均衡度级别的 Recall@20 和 Hit@20
在图 3(a)–(c) 及 (d)–(f) 中, 随着数据组 ID 的增大, 每个数据组中的开发人员修复的 bug 数量也逐渐增加, 表
明数据组的数据不均衡性减弱. 从图 3 展示的实验结果也可以看出, CBT-MF 相对于 SGL 在不均衡数据的处理上
具有更好的性能表现, 这一结论可以得到 GC、MC 及 MF 这 3 个不同数据集上实验结果验证. 因为在数据组 ID
增大的过程中, 无论是从 Recall@20 还是 Hit@20 来看, CBT-MF 的性能均有所提高, 这表明在不均衡数据组中,
CBT-MF 对于处理较多 bug 数量的数据组具有更好的性能. 此外, 从子图 3(c) 和 (f) 中还可以看出, MF 数据组相
对于 GC 和 MC 数据组中开发人员平均修复的 bug 数量较多, 数据不均衡性较弱, 于是 CBT-MF 在 MF 数据组中
的性能更好. 这也再次表明数据增强可以使得 CBT-MF 对不均衡数据处理产生积极的影响. 因为, 随着 G1–G5 数
据组不均衡性的减弱, 即开发人员修复 bug 数量的增多, CBT-MF 逐渐展示出了更好的性能表现.
● RQ3: 关键超参数敏感性分析.
为了充分探讨在不同情况下超参数会如何影响 CBT-MF 的性能, 下面采用网格搜索的思路进一步研究了
CBT-MF 对采样尺度、聚类质心数、图卷积层这 3 个关键参数变化的敏感性.

