Page 417 - 《软件学报》2025年第5期
P. 417
王笑 等: 面向属性网络社团检测的度修正广义随机块模型 2317
13.31% 和 6.92%, DPSB_PG 也考虑了节点的度, 但是检测效果却没有本文提出的度修正的属性网络广义随机块
模型 DCGSB 好, 这说明在 DCGSB 模型中拓扑信息和属性信息均服从幂函数形式的分布具有一定的优势. 在异
配网络 Washington 和 Wisconsin 上, DCGSB 的 NMI 值比表现最好的对比算法 ANGM 分别提高了 1.64% 和
0.70%. ANGM 没有考虑网络中节点的度, 而本文的模型 DCGSB 考虑了节点的度, 这说明加入节点的度对提高网
络社团检测精度具有很大的帮助. 在含有社团结构的同配网络 Citeseer 上, DCGSB 模型的 NMI 值比表现最好的
对比算法 ANGM 提高了 12.09%, 但在同样含有社团结构的同配网络 Cora 上, DCGSB 的 NMI 值比对比算法
PCL_BC 低了 12.38%, 这是因为 Cora 中的社团结构没有 Citeseer 中的社团结构明显.
表 4 DCGSB 模型和对比算法在属性网络上的 NMI (均值±标准差)
算法 Cornell Texas Washington Wisconsin Cora Citeseer
PCL_DC 0.073±0.010 0.061±0.011 0.092±0.015 0.060±0.000 0.416±0.003 0.170±0.003
SA-Cluster 0.064±0.000 0.082±0.000 0.077±0.000 0.101±0.000 0.117±0.000 0.047±0.000
In-Custer 0.038±0.000 0.106±0.000 0.063±0.000 0.089±0.000 0.112±0.000 0.043±0.000
DCSBM 0.0969 0.1665 0.0987 0.0314 0.1707 0.0413
BAGC 0.040±0.006 0.052±0.007 0.053±0.006 0.034±0.015 0.008±0.005 0.017±0.000
PPSB 0.068±0.001 0.111±0.015 0.112±0.006 0.078±0.013 0.068±0.035 0.033±0.001
BANE 0.1257 0.1767 0.1682 0.2000 - 0.0924
PSB_PG 0.3131±0.0476 0.2965±0.0579 0.3235±0.0374 0.3736±0.0550 0.3012 0.2533±0.0348
DPSB_PG 0.3246±0.0385 0.3034±0.0346 0.3263±0.0247 0.3774±0.0368 0.3143±0.0205 0.2658±0.0326
ANGM 0.2909 0.2864 0.3474 0.4010 - 0.2904
DCGSB 0.3678±0.0369 0.3244±0.0625 0.3531±0.0283 0.4038±0.0294 0.3645±0.0560 0.3255±0.0253
表 5 DCGSB 模型和对比算法在属性网络上的 PWF (均值±标准差)
算法 Cornell Texas Washington Wisconsin Cora Citeseer
PCL_DC 0.281±0.000 0.316±0.018 0.326±0.034 0.274±0.002 0.441±0.002 0.299±0.002
SA-Cluster 0.386±0.000 0.383±0.000 0.474±0.000 0.398±0.000 0.282±0.000 0.298±0.000
In-Custer 0.401±0.000 0.399±0.000 0.472±0.000 0.426±0.000 0.284±0.000 0.299±0.000
BAGC 0.342±0.034 0.546±0.003 0.480±0.002 0.479±0.005 0.299±0.006 0.298±0.000
PPSB 0.308±0.007 0.467±0.005 0.358±0.009 0.328±0.006 0.190±0.010 0.190±0.005
PSB_PG 0.4378±0.0627 0.4117±0.0365 0.4879±0.0413 0.5290±0.0502 0.3554 0.3569±0.0366
DPSB_PG 0.4498±0.0476 0.4293±0.0561 0.4891±0.0175 0.5364±0.0437 0.3629 0.3854±0.0359
DCGSB 0.4869±0.0493 0.4715±0.0338 0.5162±0.0221 0.5508±0.0322 0.3879±0.0105 0.4214±0.0221
表 6 DCGSB 模型和对比算法在属性网络上的 ACC (均值±标准差)
算法 Cornell Texas Washington Wisconsin Cora Citeseer
PCL_DC 0.329±0.014 0.348±0.015 0.380±0.039 0.336±0.000 0.564±0.009 0.412±0.016
SA-Cluster 0.415±0.000 0.401±0.000 0.491±0.000 0.404±0.000 0.264±0.000 0.233±0.000
In-Custer 0.405±0.000 0.423±0.000 0.465±0.000 0.464±0.000 0.267±0.000 0.230±0.000
DCSBM 0.3794 0.4809 0.3180 0.3282 0.3848 0.2657
BAGC 0.439±0.003 0.563±0.003 0.464±0.003 0.474±0.011 0.301±0.007 0.222±0.000
PPSB 0.362±0.026 0.506±0.012 0.402±0.021 0.385±0.032 0.263±0.006 0.263±0.006
BANE 0.3805 0.4556 0.4291 0.4362 - 0.3334
PSB_PG 0.4780±0.085 0.4396±0.056 0.5348±0.0399 0.5849±0.0380 0.4494±0.671 0.5148±0.063
DPSB_PG 0.5199±0.0400 0.4438±0.0630 0.5330±0.0330 0.5884±0.0466 0.4339±0.0249 0.5233±0.0360
ANGM 0.4421 0.5059 0.5435 0.5660 - 0.5498
DCGSB 0.5508±0.0458 0.5155±0.0658 0.5563±0.0280 0.6086±0.0296 0.5389±0.0302 0.5629±0.0287
与考虑节点度并且服从 Poisson 分布的 DPSB_PG 模型相比, 在 3 个属性网络数据集上, 不论是 NMI 指标, 还
是 PWF 和 ACC 指标, 模型 DCGSB 都比 DPSB_PG 的值高, 进一步说明了本文提出的模型 DCGSB 中, 让拓扑信
息和属性信息均服从幂函数形式的分布对于多种网络社团检测均表现出良好的性能.