Page 458 - 《软件学报》2025年第5期
P. 458

2358                                                       软件学报  2025  年第  36  卷第  5  期


                    分析  minPts 的取值变化对算法空间开销的影响, 其他参数取值如下: Eps=5, minSup=0.003, maxNR=0.1, 算法
                 在  minPts 变化时空间开销比较如图       9  所示.
                    由图  9  可以看到, 在  2  个数据集上随着     minPts 增加, ICFPM  算法、Naive-T1  算法和  Naive-T2  算法空间开销
                 和模式数量逐渐减少. 这是因为          minPts 越大, 簇的数量越少, 候选项集也越少, 减少了搜索空间和空间复杂度, 从
                 而减少了算法空间开销和模式数量, 这与空间复杂度分析结果相同. 而                      Naive 算法和  Naive-NoPrune 算法的空间
                 开销不随着    minPts 增加而改变, 这是因为只通过频繁阈值剪枝, 并没有改变算法搜索空间, 所以算法空间开销和
                 空间复杂度也不会随着        minPts 增加而变化. 同时, 可以在     2  个数据集上观察到在相同        minPts 取值下, ICFPM  算法
                 相对于其他    4  种算法空间开销总是最少, 并且         Naive-NoPrune 算法要好于   Naive 算法, 这与空间复杂度分析结果
                 相同. 当  minPts 取  3  时, Naive 算法要比  ICFPM  多消耗约  300 MB  空间.

                                                       2 000                                    700
                       400                                      400
                                                       1 750                                    600
                      Memory (MB)  300                 1 250 Number of patterns  Memory (MB)  300  400 Number of patterns
                                                       1 500
                                                                                                500
                                                       1 000
                                                                200
                       200
                                                                                                300
                                                       500
                       100                             750      100                             200
                                                       250                                      100
                         0                             0          0                             0
                             3    5     7    9    11                  3     5    7    9    11
                                      minPts                                   minPts
                                    (a) Value-Inc                              (b) MBA
                                      Naive  Naive-NoPrune  Naive-T2  Naive-T1  ICFPM  Patterns
                                            图 9 算法在    minPts 变化时空间开销比较

                    分析  maxNR  的取值变化对算法空间开销的影响. 其他参数取值如下: Eps=5, minSup=0.003, minPts=10, 算法
                 在  maxNR  变化时空间开销比较如图       10  所示.


                                                      6 000                                     1 750
                       400                                      400
                                                      5 000     300                             1 500
                      Memory (MB)  200                4 000 Number of patterns  Memory (MB)  200  1 000 Number of patterns
                                                                                                1 250
                       300
                                                      3 000
                                                                                                750
                       100                            2 000     100                             500
                                                      1 000                                     250
                        0                             0           0                             0
                             0   0.1   0.2  0.3  0.4                  0    0.1  0.2   0.3  0.4
                                     maxNR                                     maxNR
                                    (a) Value-Inc                             (b) MBA
                                      Naive  Naive-NoPrune  Naive-T2  Naive-T1  ICFPM  Patterns
                                            图 10 算法在   maxNR  变化时空间开销比较

                    由图  10  可以看到, 在  2  个数据集上随着    maxNR  增加, ICFPM  算法、Naive-T1  算法和  Naive-T2  算法空间开销
                 和模式数量逐渐增加. 这是因为          maxNR  越大, 允许存在的噪点越多, 产生更多候选项集, 增加了搜索空间和空间复
                 杂度, 从而增加了算法空间开销和模式数量, 这与空间复杂度分析结果相同. 而                       Naive 算法和  Naive-NoPrune 算法
                 的空间开销不随着       maxNR  增加而改变, 这是因为只通过频繁阈值剪枝, 并没有改变算法搜索空间, 所以算法空间
                 开销和空间复杂度也不会随着            minPts 增加而变化. 同时, 可以在      2  个数据集上观察到在相同         maxNR  取值下,
   453   454   455   456   457   458   459   460   461   462   463