Page 458 - 《软件学报》2025年第5期
P. 458
2358 软件学报 2025 年第 36 卷第 5 期
分析 minPts 的取值变化对算法空间开销的影响, 其他参数取值如下: Eps=5, minSup=0.003, maxNR=0.1, 算法
在 minPts 变化时空间开销比较如图 9 所示.
由图 9 可以看到, 在 2 个数据集上随着 minPts 增加, ICFPM 算法、Naive-T1 算法和 Naive-T2 算法空间开销
和模式数量逐渐减少. 这是因为 minPts 越大, 簇的数量越少, 候选项集也越少, 减少了搜索空间和空间复杂度, 从
而减少了算法空间开销和模式数量, 这与空间复杂度分析结果相同. 而 Naive 算法和 Naive-NoPrune 算法的空间
开销不随着 minPts 增加而改变, 这是因为只通过频繁阈值剪枝, 并没有改变算法搜索空间, 所以算法空间开销和
空间复杂度也不会随着 minPts 增加而变化. 同时, 可以在 2 个数据集上观察到在相同 minPts 取值下, ICFPM 算法
相对于其他 4 种算法空间开销总是最少, 并且 Naive-NoPrune 算法要好于 Naive 算法, 这与空间复杂度分析结果
相同. 当 minPts 取 3 时, Naive 算法要比 ICFPM 多消耗约 300 MB 空间.
2 000 700
400 400
1 750 600
Memory (MB) 300 1 250 Number of patterns Memory (MB) 300 400 Number of patterns
1 500
500
1 000
200
200
300
500
100 750 100 200
250 100
0 0 0 0
3 5 7 9 11 3 5 7 9 11
minPts minPts
(a) Value-Inc (b) MBA
Naive Naive-NoPrune Naive-T2 Naive-T1 ICFPM Patterns
图 9 算法在 minPts 变化时空间开销比较
分析 maxNR 的取值变化对算法空间开销的影响. 其他参数取值如下: Eps=5, minSup=0.003, minPts=10, 算法
在 maxNR 变化时空间开销比较如图 10 所示.
6 000 1 750
400 400
5 000 300 1 500
Memory (MB) 200 4 000 Number of patterns Memory (MB) 200 1 000 Number of patterns
1 250
300
3 000
750
100 2 000 100 500
1 000 250
0 0 0 0
0 0.1 0.2 0.3 0.4 0 0.1 0.2 0.3 0.4
maxNR maxNR
(a) Value-Inc (b) MBA
Naive Naive-NoPrune Naive-T2 Naive-T1 ICFPM Patterns
图 10 算法在 maxNR 变化时空间开销比较
由图 10 可以看到, 在 2 个数据集上随着 maxNR 增加, ICFPM 算法、Naive-T1 算法和 Naive-T2 算法空间开销
和模式数量逐渐增加. 这是因为 maxNR 越大, 允许存在的噪点越多, 产生更多候选项集, 增加了搜索空间和空间复
杂度, 从而增加了算法空间开销和模式数量, 这与空间复杂度分析结果相同. 而 Naive 算法和 Naive-NoPrune 算法
的空间开销不随着 maxNR 增加而改变, 这是因为只通过频繁阈值剪枝, 并没有改变算法搜索空间, 所以算法空间
开销和空间复杂度也不会随着 minPts 增加而变化. 同时, 可以在 2 个数据集上观察到在相同 maxNR 取值下,