Page 400 - 《软件学报》2025年第4期
P. 400

1806                                                       软件学报  2025  年第  36  卷第  4  期



                                                    表 1 真实二部图数据

                      数据集              |L|            |R|             m            d 1max       d 2max
                      Youtube         94 238         30 087         293 360        1 035        7 591
                     ActMovies        127 823        383 640       1 470 404        294          646
                       IMDB           303 617        896 302       3 782 463       1 334        1 590
                      Wiki-Cat       1 853 493       182 947       3 795 796        54          11 593
                      Twitter         175 214        530 418       4 664 605        968         19 805
                       DBLP          1 953 085      5 624 219      12 282 059      1 386         287

                    (3) 参数设置: 所有的算法均包含了两个参数             k 和   q , 其  q 表示极大  k-缺陷二团的顶点数量的阈值, 即任何所
                 输出的   k-缺陷二团   (A,B) 均满足  |A| ⩾ q 且  |B| ⩾ q . 本文选择  k 为  1–4  的整数, 其默认值为  1;   q 为  8–16  的整数. 由
                 于     ActMovies 和  DBLP  中的极大  k-缺陷二团比较小, 本文针对该数据设置      q  的取值范围为    5–10  的整数.
                 5.2   实验结果
                    实验  1: 算法的性能分析. 本文首先测试了各个算法枚举大小约束的极大                     k-缺陷二团时的性能. 图      5  展示了各
                 个算法在分别变化参数        k 和  q  时处理不同真实二部图的运行时间. 值得注意的是, 本实验限定各个算法的运行时
                 间为  24 h, 当超过约束时间时, 其运行时间将设置为           INF. 从图  5  的实验结果可以看出, 基准算法       Basic 在绝大部分
                 参数情况下的运行时间均超过了            24 h  的时间限制, 而且除了少数参数所有算法均能高效计算外, 所提出的优化分
                 支算法   iMDCE  的运行时间均远低于所提出的           MDCE  算法. 例如, 在   IMDB  二部图中, 当    k = 1  以及  q = 14  时,
                 iMDCE  的运行时间为    37.99 s, 但是  MDCE  和  Basic 在相同条件下的运行时间为      606.83 s 和  60 279.2 s. 表明了所
                 提出的分支技术相较于传统分枝定界方法在减少冗余计算方面具有极大的性能优势. 此外, 当                              k 较大或者   q  较小
                 时, 所提算法   iMDCE  相较于  MDCE  具有更高的加速比. 例如, 在二部图          IMDB  中, 当  k = 1 q = 14 时, iMDCE  相
                                                                                        ,
                 较于  MDCE  的加速比为    15.9, 但是当  q = 12 时, iMDCE  相较于  MDCE  的加速比超过了   300  倍. 该实验进一步表
                 明提出的优化分支技术在减少冗余分支方面的优越性.

                    INF                   INF                  INF           iMDCE   INF   iMDCE
                                                                             MDCE          MDCE
                    10 4                  10 4                  10 4         Basic    10 4  Basic
                                                                                    时间 (s)
                   时间 (s)  10 3          时间 (s)  10 3          时间 (s) INF
                                                                                      10 3
                                                                10 3
                                          10 2
                    10 2
                                                       MDCE
                         MDCE
                    10 1  iMDCE           10 1         iMDCE    10 2                  10 2
                         Basic                         Basic
                    10 0                  10 0                  10 1                  10 1
                       8  10  12  14  16     1   2    3   4       5  6  7  8  9  10     1    2    3   4
                              q                    k                     q                     k
                         (a) Youtube (k=1)    (b) Youtube (q=16)   (c) ActMovies (k=1)   (d) ActMovies (q=10)
                    INF                   INF                  INF                   INF
                         iMDCE                       iMDCE           iMDCE                         iMDCE
                    10 4  MDCE            10 4       MDCE       10 4  MDCE            10 4         MDCE
                   时间 (s)  10 3          时间 (s)  10 3          时间 (s)  10 3         时间 (s)  10 3
                         Basic
                                                                     Basic
                                                     Basic
                                                                                                   Basic
                    10 2                  10 2                  10 2                  10 2
                                                                10 1                  10 1
                    10 1                  10 1
                       8  10  12  14  16     1   2    3   4       8  10  12  14  16     1    2    3   4
                              q                    k                     q                     k
                         (e) IMDB (k=1)        (f) IMDB (q=16)      (g) Wiki-Cat (k=1)   (h) Wiki-Cat (q=16)
                    INF                   INF
                                                                                      10 4
                    10 4                  10 4                  10 4  iMDCE                        iMDCE
                   时间 (s)  10 3          时间 (s)  10 3          时间 (s)  10 3  Basic   时间 (s)  10 3  Basic
                                                                     MDCE
                                                                                                   MDCE
                    10 2  iMDCE           10 2         iMDCE    10 2                  10 2
                         MDCE
                                                       MDCE
                         Basic                         Basic
                    10 1                  10 1                  10 1                  10 1
                       8  10  12  14  16     1   2    3   4       5  6  7  8  9  10     1    2    3   4
                              q                    k                     q                     k
                         (i) Twitter (k=1)    (j) Twitter (q=16)     (k) DBLP (k=1)       (l) DBLP (q=10)
                                            图 5 不同算法在真实二部图上的运行时间

                    实验  2: 优化技术的效果. 为了测试所提优化技术对所提算法性能的影响, 本实验还测试了所提算法在排除各
                 个优化技术时的运行时间. 表         2  和表  3  展示了算法  iMDCE  在不包含不同优化技术条件下变化参数             k 和  q 时枚举
   395   396   397   398   399   400   401   402   403   404   405