Page 199 - 《软件学报》2024年第6期
P. 199
软件学报 ISSN 1000-9825, CODEN RUXUEW E-mail: jos@iscas.ac.cn
Journal of Software,2024,35(6):2775−2794 [doi: 10.13328/j.cnki.jos.006904] http://www.jos.org.cn
©中国科学院软件研究所版权所有. Tel: +86-10-62562563
*
基于多标签学习的代码评审意见质量评价
杨岚心 1,2 , 张 贺 1,2 , 徐近伟 1,2 , 张逸凡 1,2 , 王梓宽 1,2 , 周 鑫 1,2 , 李京悦 3 , 荣国平 1,2
1
(南京大学 软件学院, 江苏 南京 210093)
(计算机软件新技术国家重点实验室 (南京大学), 江苏 南京 210093)
2
3
(Department of Computer Science, Norwegian University of Science and Technology, Trondheim 7030, Norway)
通信作者: 张贺, E-mail: hezhang@nju.edu.cn
摘 要: 代码评审是现代软件开发过程中被广泛应用的最佳实践之一, 其对于软件质量保证和工程能力提升都具
有重要意义. 代码评审意见是代码评审最主要和最重要的产出之一, 其不仅是评审者对代码变更的质量感知, 而且
是作者修复代码缺陷和提升质量的重要参考. 目前, 全球各大软件组织都相继制定了代码评审指南, 但仍缺少针对
代码评审意见质量的有效的评价方式和方法. 为了实现可解释的、自动化的评价, 开展文献综述、案例分析等若
干实证研究, 并在此基础上提出一种基于多标签学习的代码评审意见质量评价方法. 实验使用某大型软件企业的
34 个商业项目的共计 17 000 条评审意见作为数据集. 结果表明所提出的方法能够有效地评价代码评审意见质量
属性和质量等级. 除此以外, 还提供若干建模经验, 如评审意见标注和校验等, 旨在帮助那些受代码评审困扰的软
件组织更好地实施所提出的方法.
关键词: 软件质量保证; 代码评审; 代码评审意见; 质量评价; 多标签学习; 实证软件工程
中图法分类号: TP311
中文引用格式: 杨岚心, 张贺, 徐近伟, 张逸凡, 王梓宽, 周鑫, 李京悦, 荣国平. 基于多标签学习的代码评审意见质量评价. 软件学
报, 2024, 35(6): 2775–2794. http://www.jos.org.cn/1000-9825/6904.htm
英文引用格式: Yang LX, Zhang H, Xu JW, Zhang YF, Wang ZK, Zhou X, Li JY, Rong GP. Multi-label Learning for Evaluating
Quality of Code Review Comments. Ruan Jian Xue Bao/Journal of Software, 2024, 35(6): 2775–2794 (in Chinese). http://www.jos.org.
cn/1000-9825/6904.htm
Multi-label Learning for Evaluating Quality of Code Review Comments
1,2
1,2
1,2
1,2
1,2
1,2
YANG Lan-Xin , ZHANG He , XU Jin-Wei , ZHANG Yi-Fan , WANG Zi-Kuan , ZHOU Xin ,
3 1,2
LI Jing-Yue , RONG Guo-Ping
1
(Software Institute, Nanjing University, Nanjing 210093, China)
2
(State Key Laboratory of Novel Software Technology at Nanjing University, Nanjing 210093, China)
3
(Department of Computer Science, Norwegian University of Science and Technology, Trondheim 7030, Norway)
Abstract: Code review is one of the best practices widely used in modern software development, which is crucial for ensuring software
quality and strengthening engineering capability. Code review comments (CRCs) are one of the main and most important outputs of code
reviews. CRCs are not only the reviewers’ perceptions of code quality but also the references for authors to fix code defects and improve
quality. Nowadays, although a number of software organizations have developed guidelines for performing code reviews, there are still few
effective methods for evaluating the quality of CRCs. To provide an explainable and automated quality evaluation of CRCs, this study
conducts a series of empirical studies such as literature reviews and case analyses. Based on the results of the empirical studies, the study
proposes a multi-label learning-based approach for evaluating the quality of CRCs. Experiments are carried out by using a large software
* 基金项目: 国家自然科学基金 (62072227, 62202219); 国家重点研发计划 (2019YFE0105500); 江苏省重点研发计划 (BE2021002-2); 南京
大学计算机软件新技术国家重点实验室创新项目 (ZZKT2022A25); 海外开放课题 (KFKT2022A09)
收稿时间: 2022-06-15; 修改时间: 2022-09-19; 采用时间: 2023-01-19; jos 在线出版时间: 2023-08-16
CNKI 网络首发时间: 2023-08-17