Page 41 - 《软件学报》2021年第12期
P. 41

蒋竞  等:开源社区评审过程度量体系及其实证研究                                                         3705


         分析结果是否显著.表 3 的结果表明:大多数 p 值都小于 0.001,结果具有显著的统计学意义.
                  Table 3    Relationship between current time period index and next time period module defect
                             表 3   当前时间段指标和下一个时间段模块缺陷的相关系数
                                 指标                   Xbmc    Roslyn  elasticsearch  相关性
                                   评审次数              0.552***  0.639***  0.792***   不确定
                                  评审信息长度             0.450***  0.477***  0.707***   不确定
                  评审活动
                                   评审时间              0.489***  0.487***  0.702***   不确定
                                  代码改动行数             0.416***  0.405***  0.568***   中等正相关
                                  改动者数量              0.440***  0.395***  0.651***   中等正相关
                                  评论者数量              0.414***  0.426***  0.633***   中等正相关
                                  决策者数量              0.411***  0.407***  0.656***   中等正相关
                           多改动、多评论、多决策者的比例           0.132***  −0.262***  −0.177***   不确定
                           多改动、少评论、多决策者的比例           0.116**   −0.013   0.263***   不确定
                  人员分布     少改动、多评论、多决策者的比例           0.136***  0.067**  0.240***  弱正相关
                           少改动、少评论、多决策者的比例          −0.092***  −0.025   −0.005   弱负相关
                           多改动、多评论、少决策者的比例           0.140***  0.094***  0.070**   弱正相关
                           多改动、少评论、少决策者的比例           0.271***  0.261***  0.429***   不确定
                           少改动、多评论、少决策者的比例          −0.073***  −0.290***  −0.316***   不确定
                           少改动、少评论、少决策者的比例           0.418***  0.402***  0.585***   中等正相关

             在人员分布指标中,改动者数量,评论者数量,决策者数量,少改动、少评论、少决策者的比例也和软件缺陷
         成中等正相关性,相关系数基本在 0.4 到 0.7 之间.另外,多改动、少评论、少决策者的比例和软件缺陷数量的相
         关性系数接近 0.3,接近中等正相关.
             从表 3 可以看出:少改动、多评论、少决策者的比例与软件缺陷数量相关系数接近在−0.1 到−0.3 之间,表
         现为负相关性;而多改动、少评论、少决策者的比例与软件缺陷数量相关系数在 0.2 到 0.4 之间,接近中等正相
         关性.可以看出:开发人员并不只是通过代码改动来参与软件的开发,开发人员还可以通过评论和评审来对开源
         项目做贡献.多改动但是评论和决策贡献量小的开发者的比例,反而与软件缺陷成正相关;少改动但是评论和决
         策贡献量大的开发者的比例,与软件缺陷成负相关.如果度量体系不考虑评论者和决策者,那么少改动、多评论、
         少决策者的比例与软件缺陷的相关性就会被忽视掉,这说明本文在设计评估体系时考虑评审指标是合理的.
             与现有工作    [2,3] 相比,本文提出的评审过程度量体系增加了决策者指标.为了分析决策者指标的有效性,本
         文分别统计只考虑改动者和评论者的度量体系、只考虑改动者的度量体系与软件缺陷数量的关系,结果详见表
         4 和表 5.
                    Table 4    Relationship of modifier and commentator between current time period index
                                        and next time period module defect
                   表 4   只考虑改动者和评论者的当前时间段指标和下一个时间段模块缺陷的相关系数
                              指标                 xbmc       Roslyn   elasticsearch  相关性
                                评审次数            0.552***   0.639***   0.792***    不确定
                               评审信息长度           0.450***   0.477***   0.707***    不确定
                  评审活动
                                评审时间            0.489***   0.487***   0.702***    不确定
                               代码改动行数           0.416***   0.405***   0.568***  中等正相关
                               改动者数量            0.440***   0.395***   0.651***  中等正相关
                               评论者数量            0.414***   0.426***   0.633***  中等正相关
                           多改动、多评论者的比例          0.105***   −0.254***   −0.187***   不确定
                  人员分布
                           多改动、少评论者的比例          0.266***   0.093***   0.327***    不确定
                           少改动、多评论者的比例           −0.026    −0.279***   −0.303***   不确定
                           少改动、少评论者的比例           0.050     0.339***   0.318***    不确定
   36   37   38   39   40   41   42   43   44   45   46