Page 199 - 《软件学报》2024年第6期
P. 199

软件学报 ISSN 1000-9825, CODEN RUXUEW                                        E-mail: jos@iscas.ac.cn
                 Journal of Software,2024,35(6):2775−2794 [doi: 10.13328/j.cnki.jos.006904]  http://www.jos.org.cn
                 ©中国科学院软件研究所版权所有.                                                          Tel: +86-10-62562563



                                                                   *
                 基于多标签学习的代码评审意见质量评价

                 杨岚心  1,2 ,    张    贺  1,2 ,    徐近伟  1,2 ,    张逸凡  1,2 ,    王梓宽  1,2 ,    周    鑫  1,2 ,    李京悦  3 ,    荣国平  1,2


                 1
                  (南京大学 软件学院, 江苏 南京 210093)
                  (计算机软件新技术国家重点实验室        (南京大学), 江苏 南京 210093)
                 2
                 3
                  (Department of Computer Science, Norwegian University of Science and Technology, Trondheim 7030, Norway)
                 通信作者: 张贺, E-mail: hezhang@nju.edu.cn

                 摘 要: 代码评审是现代软件开发过程中被广泛应用的最佳实践之一, 其对于软件质量保证和工程能力提升都具
                 有重要意义. 代码评审意见是代码评审最主要和最重要的产出之一, 其不仅是评审者对代码变更的质量感知, 而且
                 是作者修复代码缺陷和提升质量的重要参考. 目前, 全球各大软件组织都相继制定了代码评审指南, 但仍缺少针对

                 代码评审意见质量的有效的评价方式和方法. 为了实现可解释的、自动化的评价, 开展文献综述、案例分析等若
                 干实证研究, 并在此基础上提出一种基于多标签学习的代码评审意见质量评价方法. 实验使用某大型软件企业的
                 34  个商业项目的共计     17 000  条评审意见作为数据集. 结果表明所提出的方法能够有效地评价代码评审意见质量
                 属性和质量等级. 除此以外, 还提供若干建模经验, 如评审意见标注和校验等, 旨在帮助那些受代码评审困扰的软
                 件组织更好地实施所提出的方法.
                 关键词: 软件质量保证; 代码评审; 代码评审意见; 质量评价; 多标签学习; 实证软件工程
                 中图法分类号: TP311

                 中文引用格式: 杨岚心, 张贺, 徐近伟, 张逸凡, 王梓宽, 周鑫, 李京悦, 荣国平. 基于多标签学习的代码评审意见质量评价. 软件学
                 报, 2024, 35(6): 2775–2794. http://www.jos.org.cn/1000-9825/6904.htm
                 英文引用格式: Yang LX, Zhang H, Xu JW, Zhang YF, Wang ZK, Zhou X, Li JY, Rong GP. Multi-label Learning for Evaluating
                 Quality of Code Review Comments. Ruan Jian Xue Bao/Journal of Software, 2024, 35(6): 2775–2794 (in Chinese). http://www.jos.org.
                 cn/1000-9825/6904.htm

                 Multi-label Learning for Evaluating Quality of Code Review Comments

                                        1,2
                            1,2
                                                   1,2
                                                                               1,2
                                                                                          1,2
                                                                 1,2
                 YANG Lan-Xin , ZHANG He , XU Jin-Wei , ZHANG Yi-Fan , WANG Zi-Kuan , ZHOU Xin ,
                         3             1,2
                 LI Jing-Yue , RONG Guo-Ping
                 1
                 (Software Institute, Nanjing University, Nanjing 210093, China)
                 2
                 (State Key Laboratory of Novel Software Technology at Nanjing University, Nanjing 210093, China)
                 3
                 (Department of Computer Science, Norwegian University of Science and Technology, Trondheim 7030, Norway)
                 Abstract:  Code  review  is  one  of  the  best  practices  widely  used  in  modern  software  development,  which  is  crucial  for  ensuring  software
                 quality  and  strengthening  engineering  capability.  Code  review  comments  (CRCs)  are  one  of  the  main  and  most  important  outputs  of  code
                 reviews.  CRCs  are  not  only  the  reviewers’  perceptions  of  code  quality  but  also  the  references  for  authors  to  fix  code  defects  and  improve
                 quality. Nowadays, although a number of software organizations have developed guidelines for performing code reviews, there are still few
                 effective  methods  for  evaluating  the  quality  of  CRCs.  To  provide  an  explainable  and  automated  quality  evaluation  of  CRCs,  this  study
                 conducts  a  series  of  empirical  studies  such  as  literature  reviews  and  case  analyses.  Based  on  the  results  of  the  empirical  studies,  the  study
                 proposes  a  multi-label  learning-based  approach  for  evaluating  the  quality  of  CRCs.  Experiments  are  carried  out  by  using  a  large  software


                 *    基金项目: 国家自然科学基金  (62072227, 62202219); 国家重点研发计划  (2019YFE0105500); 江苏省重点研发计划  (BE2021002-2); 南京
                  大学计算机软件新技术国家重点实验室创新项目           (ZZKT2022A25); 海外开放课题  (KFKT2022A09)
                  收稿时间: 2022-06-15; 修改时间: 2022-09-19; 采用时间: 2023-01-19; jos 在线出版时间: 2023-08-16
                  CNKI 网络首发时间: 2023-08-17
   194   195   196   197   198   199   200   201   202   203   204