Page 416 - 《软件学报》2025年第5期
P. 416

2316                                                       软件学报  2025  年第  36  卷第  5  期


                 节点度的   DCGSB  模型进行了实验. 表      2  显示了两个模型分别在       3  个网络数据集上     30  次实验结果的   NMI、PWF
                 和  ACC  的平均值和标准差.

                                         表 2 节点度对社团检测精度的影响           (均值±标准差)

                  评价指标      模型      Cornell      Texas     Washington  Wisconsin     Cora       Citeseer
                           CGSB   0.2952±0.0608  0.3077±0.0628  0.3271±0.0472  0.3899±0.0774  0.3350±0.0291  0.2936±0.0237
                    NMI
                          DCGSB   0.3678±0.0369  0.3244±0.0625  0.3531±0.0283  0.4038±0.0294  0.3645±0.0250  0.3255±0.0253
                           CGSB   0.4860±0.0749  0.4213±0.0456  0.5142±0.0408  0.5576±0.0408  0.3735±0.0277  0.3936±0.0250
                   PWF
                          DCGSB   0.4869±0.0493  0.4715±0.0338  0.5162±0.0221  0.5508±0.0322  0.3879±0.0105  0.4214±0.0221
                           CGSB   0.5427±0.0781  0.4708±0.0590  0.5321±0.0630  0.5887±0.0543  0.5201±0.0354  0.5119±0.0323
                    ACC
                          DCGSB   0.5508±0.0458  0.5155±0.0658  0.5563±0.0280  0.6086±0.0296  0.5389±0.0302  0.5629±0.0287

                    由表  2 可以看出, 除了在网络      Wisconsin 上, 没有加节点度的    CGSB  模型的  PWF  指标比加了节点度的      DCGSB
                 模型稍微高了一点外, 其余网络上的            NMI、PWF   以及  ACC  都是加了节点度的      DCGSB  模型比没有加节点度的
                 CGSB  模型高, 并且在网络     Cornell, Texas, Washington, Wisconsin, Cora 以及  Citeseer 上, DCGSB  模型的  NMI 指标
                 比  CGSB  模型的  NMI 指标分别提高了     24.59%, 5.43%, 7.95%, 3.57%, 8.81%, 10.87%, 说明引入节点度刻画网络的
                 无标度特征对社团检测精度是有积极影响的.
                    为了验证节点度与节点属性之间的关系, 本文在对网络拓扑信息和节点属性建模时, 只在网络拓扑信息中引
                 入节点度的模型      TGSB  与对两者都引入节点度的模型          DCGSB  进行了对比. 表    3  是两个模型在表    1  所示的  3  个网
                 络数据集上进行      30  次实验结果的   NMI、PWF   以及  ACC  的平均值和标准差.


                                         表 3 节点度与节点属性之间的关系           (均值±标准差)

                  评价指标      模型      Cornell      Texas     Washington  Wisconsin     Cora       Citeseer
                           TGSB   0.3027±0.0487  0.2377±0.0595  0.2875±0.0277  0.3886±0.0582  0.2353±0.0387  0.2791±0.0290
                    NMI
                          DCGSB   0.3678±0.0369  0.3244±0.0625  0.3531±0.0283  0.4038±0.0294  0.3645±0.0250  0.3255±0.0253
                           TGSB   0.4489±0.0866  0.4028±0.0349  0.4779±0.0484  0.5436±0.0604  0.3111±0.0342  0.3756±0.0256
                   PWF
                          DCGSB   0.4869±0.0493  0.4715±0.0338  0.5162±0.0221  0.5508±0.0322  0.3879±0.0105  0.4214±0.0221
                           TGSB   0.4862±0.0619  0.4219±0.0515  0.5400±0.0624  0.5962±0.0729  0.4510±0.0607  0.5200±0.0222
                    ACC
                          DCGSB   0.5508±0.0458  0.5155±0.0658  0.5563±0.0280  0.6086±0.0296  0.5389±0.0302  0.5629±0.0287

                    由表  3  可以看出, 对网络拓扑信息和节点属性建模时, 两者都引入节点度的                    DCGSB  模型各个评价指标都比
                 只在网络拓扑信息中引入节点度的             TGSB  模型高, 其中在网络     Cornell, Texas, Washington, Wisconsin, Cora 以及
                 Citeseer 上, DCGSB  模型的  NMI 指标比只在网络拓扑信息中引入节点度的               TGSB  模型分别提高了       21.51%,
                 36.47%, 22.82%, 3.91%, 54.91%, 16.62 %, 说明在这些网络中节点度与节点属性具有一定的相关性.

                 5.5   社团检测结果与分析
                    为了评估模型      DCGSB  的检测精度, 本文在表      1  所示的  3  个网络数据集上进行社团检测实验, 与现有生成模
                                    [9]
                 型  PCL_DC [27] 、DCSBM 、PPSB [28] 、PSB_PG [20] 、DPSB_PG [21] 以及  ANGM [19] 进行了对比, 并且与经典的社团检
                                         [1]
                 测算法   SA-Cluster [39] 、In-Custer 、BAGC [40] 以及  BANE [41] 进行了比较. 为了保持实验的公平性, 对比算法的参数
                 都采用原文献中的最优参数, 实验结果如表             4、表  5 和表  6 所示, 其中红色加粗数值表示        11 个算法中最好的     NMI、
                 PWF  和  ACC, 黑色加粗表示次好的; BANE      和  ANGM  的数据来自文献      [19]; SA-Cluster、In-Custer、PCL_DC、
                 PPSB  以及  BAGC  的数据来自文献    [42]; DCSBM  的数据来自文献    [43]. 表  4  是  11  种算法的  NMI 指标, 表  5  是  11
                 种算法的    PWF  指标, 表  6  是  11  种算法的  ACC  指标. 为了使实验结果更稳定, 我们对每个算法进行了            30  次实验,
                 给出了   3  个指标  30  次的平均值和标准差.
                    由实验结果可以看出, 与其他          10  种算法相比, 本文提出的      DCGSB  模型不仅适用于多种网络结构检测, 而且
                 表现出更好的检测精度和性能. 在含有混合结构的异配网络                   (Cornell, Texas, Washington, Wisconsin) 上, NMI 的值
                 都是最优的. 在网络      Cornell 和  Texas 上, DCGSB  模型的  NMI 值比表现最好的对比算法       DPSB_PG  分别提高了
   411   412   413   414   415   416   417   418   419   420   421