Page 417 - 《软件学报》2025年第5期
P. 417

王笑 等: 面向属性网络社团检测的度修正广义随机块模型                                                     2317


                 13.31%  和  6.92%, DPSB_PG  也考虑了节点的度, 但是检测效果却没有本文提出的度修正的属性网络广义随机块
                 模型  DCGSB  好, 这说明在   DCGSB  模型中拓扑信息和属性信息均服从幂函数形式的分布具有一定的优势. 在异
                 配网络   Washington  和  Wisconsin  上, DCGSB  的  NMI 值比表现最好的对比算法    ANGM  分别提高了     1.64%  和
                 0.70%. ANGM  没有考虑网络中节点的度, 而本文的模型            DCGSB  考虑了节点的度, 这说明加入节点的度对提高网
                 络社团检测精度具有很大的帮助. 在含有社团结构的同配网络                     Citeseer 上, DCGSB  模型的  NMI 值比表现最好的
                 对比算法    ANGM  提高了   12.09%, 但在同样含有社团结构的同配网络             Cora  上, DCGSB  的  NMI 值比对比算法
                 PCL_BC  低了  12.38%, 这是因为  Cora 中的社团结构没有     Citeseer 中的社团结构明显.

                                   表 4 DCGSB  模型和对比算法在属性网络上的            NMI (均值±标准差)

                    算法         Cornell       Texas     Washington    Wisconsin     Cora        Citeseer
                   PCL_DC     0.073±0.010  0.061±0.011  0.092±0.015  0.060±0.000  0.416±0.003  0.170±0.003
                  SA-Cluster  0.064±0.000  0.082±0.000  0.077±0.000  0.101±0.000  0.117±0.000  0.047±0.000
                   In-Custer  0.038±0.000  0.106±0.000  0.063±0.000  0.089±0.000  0.112±0.000  0.043±0.000
                   DCSBM       0.0969       0.1665       0.0987       0.0314       0.1707       0.0413
                    BAGC      0.040±0.006  0.052±0.007  0.053±0.006  0.034±0.015  0.008±0.005  0.017±0.000
                    PPSB      0.068±0.001  0.111±0.015  0.112±0.006  0.078±0.013  0.068±0.035  0.033±0.001
                    BANE       0.1257       0.1767       0.1682       0.2000        -           0.0924
                   PSB_PG    0.3131±0.0476  0.2965±0.0579  0.3235±0.0374  0.3736±0.0550  0.3012  0.2533±0.0348
                   DPSB_PG   0.3246±0.0385  0.3034±0.0346  0.3263±0.0247  0.3774±0.0368  0.3143±0.0205  0.2658±0.0326
                   ANGM        0.2909       0.2864       0.3474       0.4010        -           0.2904
                   DCGSB     0.3678±0.0369  0.3244±0.0625  0.3531±0.0283  0.4038±0.0294  0.3645±0.0560  0.3255±0.0253


                                  表 5 DCGSB   模型和对比算法在属性网络上的           PWF (均值±标准差)

                    算法         Cornell       Texas     Washington    Wisconsin     Cora        Citeseer
                   PCL_DC     0.281±0.000  0.316±0.018  0.326±0.034  0.274±0.002  0.441±0.002  0.299±0.002
                  SA-Cluster  0.386±0.000  0.383±0.000  0.474±0.000  0.398±0.000  0.282±0.000  0.298±0.000
                   In-Custer  0.401±0.000  0.399±0.000  0.472±0.000  0.426±0.000  0.284±0.000  0.299±0.000
                    BAGC      0.342±0.034  0.546±0.003  0.480±0.002  0.479±0.005  0.299±0.006  0.298±0.000
                    PPSB      0.308±0.007  0.467±0.005  0.358±0.009  0.328±0.006  0.190±0.010  0.190±0.005
                   PSB_PG    0.4378±0.0627  0.4117±0.0365  0.4879±0.0413  0.5290±0.0502  0.3554  0.3569±0.0366
                   DPSB_PG   0.4498±0.0476  0.4293±0.0561  0.4891±0.0175  0.5364±0.0437  0.3629  0.3854±0.0359
                   DCGSB     0.4869±0.0493  0.4715±0.0338  0.5162±0.0221  0.5508±0.0322  0.3879±0.0105  0.4214±0.0221


                                  表 6 DCGSB   模型和对比算法在属性网络上的           ACC (均值±标准差)

                    算法         Cornell       Texas     Washington    Wisconsin     Cora        Citeseer
                   PCL_DC     0.329±0.014  0.348±0.015  0.380±0.039  0.336±0.000  0.564±0.009  0.412±0.016
                  SA-Cluster  0.415±0.000  0.401±0.000  0.491±0.000  0.404±0.000  0.264±0.000  0.233±0.000
                   In-Custer  0.405±0.000  0.423±0.000  0.465±0.000  0.464±0.000  0.267±0.000  0.230±0.000
                   DCSBM       0.3794       0.4809       0.3180       0.3282       0.3848       0.2657
                    BAGC      0.439±0.003  0.563±0.003  0.464±0.003  0.474±0.011  0.301±0.007  0.222±0.000
                    PPSB      0.362±0.026  0.506±0.012  0.402±0.021  0.385±0.032  0.263±0.006  0.263±0.006
                    BANE       0.3805       0.4556       0.4291       0.4362        -           0.3334
                   PSB_PG    0.4780±0.085  0.4396±0.056  0.5348±0.0399  0.5849±0.0380  0.4494±0.671  0.5148±0.063
                   DPSB_PG   0.5199±0.0400  0.4438±0.0630  0.5330±0.0330  0.5884±0.0466  0.4339±0.0249  0.5233±0.0360
                   ANGM        0.4421       0.5059       0.5435       0.5660        -           0.5498
                   DCGSB     0.5508±0.0458  0.5155±0.0658  0.5563±0.0280  0.6086±0.0296  0.5389±0.0302  0.5629±0.0287
                    与考虑节点度并且服从         Poisson  分布的  DPSB_PG  模型相比, 在  3  个属性网络数据集上, 不论是      NMI 指标, 还
                 是  PWF  和  ACC  指标, 模型  DCGSB  都比  DPSB_PG  的值高, 进一步说明了本文提出的模型         DCGSB  中, 让拓扑信
                 息和属性信息均服从幂函数形式的分布对于多种网络社团检测均表现出良好的性能.
   412   413   414   415   416   417   418   419   420   421   422