Page 125 - 《软件学报》2021年第10期
P. 125
朱二周 等:一种采用新型聚类方法的最佳类簇数确定算法 3097
Table 4 Processing results of the 20 synthetic datasets by different algorithms (Continued 2)
表 4 不同算法对 20 个合成数据集的处理结果(续 2)
算法 DPI-K-means DC-K-means DPC
数据集 Purity (%) 耗时(ms) Purity (%) 耗时(ms) Purity (%) 耗时(ms)
均方差 0 37 0 36 0 20
Parallel3
平均值 88.5 132 88 131 100 50
均方差 0 46 0 45 0 28
Parallel4
平均值 89.5 212 67.8 253 100 83
均方差 0 216 0 3 735 0 472
Parallel4-2
平均值 91.1 10 167 64.1 13 307 74.3 2 180
均方差 0 70 0 52 0 50
Parallel5
平均值 58.8 553 58 262 100 164
均方差 0 90 0 371 0 92
Parallel6
平均值 87.3 1 443 49.8 1 662 69.4 353
均方差 0 59 0 123 0 36
Ring2
平均值 66.6 390 78.8 372 100 125
均方差 0 49 0 43 0 30
Ring3
平均值 63.8 219 77 213 77.2 87
均方差 0 57 0 113 0 35
Ring4
平均值 66.6 372 66.6 380 100 126
均方差 0 31 0 14 0 15
Semicircle2
平均值 82.8 64 81.7 54 100 28
均方差 0 34 0 17 0 20
Semicircle3
平均值 100 127 62.6 111 100 53
均方差 0 61 0 67 0 34
Semicircle3-2
平均值 51.6 385 67.1 430 93.4 124
均方差 0 112 0 414 0 79
Semicircle4
平均值 50.3 1 493 34.2 1 563 100 331
均方差 0 76 0 45 0 43
Norm4
平均值 100 560 75.6 354 100 159
均方差 0 109 0 21 0 101
Norm6
平均值 88.0 1 083 76.1 416 100 274
均方差 0 64 0 30 0 56
Norm10
平均值 100 533 20 455 99.8 174
均方差 0 57 0 9 0 53
Norm12
平均值 83.4 539 16.7 398 100 167
与表 4 类似,表 5 是不同算法在运行 6 个真实数据集时的性能对比.
Table 5 Processing results of the 6 real datasets by different algorithms
表 5 不同算法对 6 个真实数据集的处理结果
算法 K-means-AHC AHC K-means
数据集 Purity (%) 耗时(ms) Purity (%) 耗时(ms) Purity (%) 耗时(ms)
均方差 0 12 0 72 0 35
Column2
平均值 77.6 172 67.7 498 67.7 207
均方差 0.38 13 0 80 0.41 10
Heart
平均值 65.8 139 55.7 427 59.2 161
均方差 0.28 49 0 738 0 117
German
平均值 90.4 2 584 70.2 18 832 70.2 3 787
均方差 1.41 9 0 29 21.33 32
Iris
平均值 88.1 45 72.3 102 84.6 49
均方差 0.30 12 0 56 2.92 42
Haberman
平均值 88.6 164 86.5 442 86.3 173
均方差 2.31 9 0 30 4 20
Tae
平均值 75.4 46 60.4 107 67.4 48