Page 125 - 《软件学报》2021年第10期
P. 125

朱二周  等:一种采用新型聚类方法的最佳类簇数确定算法                                                     3097


                         Table 4    Processing results of the 20 synthetic datasets by different algorithms (Continued 2)
                                       表 4   不同算法对 20 个合成数据集的处理结果(续 2)
                                        算法       DPI-K-means      DC-K-means         DPC
                           数据集                Purity (%)  耗时(ms)  Purity (%)  耗时(ms)  Purity (%)   耗时(ms)
                                      均方差       0       37      0       36       0       20
                            Parallel3
                                      平均值       88.5    132      88      131      100     50
                                      均方差       0       46      0       45       0       28
                            Parallel4
                                      平均值       89.5    212     67.8     253      100     83
                                      均方差       0      216      0      3 735     0       472
                            Parallel4-2
                                      平均值       91.1   10 167   64.1    13 307   74.3    2 180
                                      均方差       0       70      0       52       0       50
                            Parallel5
                                      平均值       58.8    553      58      262      100     164
                                      均方差       0       90      0       371      0       92
                            Parallel6
                                      平均值       87.3    1 443   49.8    1 662    69.4     353
                                      均方差       0       59      0       123      0       36
                             Ring2
                                      平均值       66.6    390     78.8     372      100     125
                                      均方差       0       49      0       43       0       30
                             Ring3
                                      平均值       63.8    219      77      213     77.2     87
                                      均方差       0       57      0       113      0       35
                             Ring4
                                      平均值       66.6    372     66.6     380      100     126
                                      均方差       0       31      0       14       0       15
                            Semicircle2
                                      平均值       82.8     64     81.7     54       100     28
                                      均方差       0       34      0       17       0       20
                            Semicircle3
                                      平均值       100     127     62.6     111      100     53
                                      均方差       0       61      0       67       0       34
                           Semicircle3-2
                                      平均值       51.6    385     67.1     430     93.4     124
                                      均方差       0      112      0       414      0       79
                            Semicircle4
                                      平均值       50.3    1 493   34.2    1 563     100     331
                                      均方差       0       76      0       45       0       43
                             Norm4
                                      平均值       100     560     75.6     354      100     159
                                      均方差       0      109      0       21       0       101
                             Norm6
                                      平均值       88.0    1 083   76.1     416      100     274
                                      均方差       0       64      0       30       0       56
                             Norm10
                                      平均值       100     533      20      455     99.8     174
                                      均方差       0       57      0        9       0       53
                             Norm12
                                      平均值       83.4    539     16.7     398      100     167
                    与表 4 类似,表 5 是不同算法在运行 6 个真实数据集时的性能对比.
                                 Table 5    Processing results of the 6 real datasets by different algorithms
                                          表 5   不同算法对 6 个真实数据集的处理结果
                                       算法      K-means-AHC         AHC             K-means
                            数据集             Purity (%)  耗时(ms)  Purity (%)  耗时(ms)  Purity (%)  耗时(ms)
                                     均方差      0       12       0       72       0       35
                            Column2
                                     平均值      77.6     172     67.7     498     67.7     207
                                     均方差     0.38     13       0       80      0.41     10
                              Heart
                                     平均值      65.8     139     55.7     427     59.2     161
                                     均方差     0.28     49       0       738      0       117
                             German
                                     平均值      90.4    2 584    70.2    18 832   70.2    3 787
                                     均方差     1.41      9       0       29      21.33    32
                              Iris
                                     平均值      88.1     45      72.3     102     84.6     49
                                     均方差     0.30     12       0       56      2.92     42
                            Haberman
                                     平均值      88.6     164     86.5     442     86.3     173
                                     均方差     2.31      9       0       30       4       20
                              Tae
                                     平均值      75.4     46      60.4     107     67.4     48
   120   121   122   123   124   125   126   127   128   129   130