Page 416 - 《软件学报》2025年第5期
P. 416
2316 软件学报 2025 年第 36 卷第 5 期
节点度的 DCGSB 模型进行了实验. 表 2 显示了两个模型分别在 3 个网络数据集上 30 次实验结果的 NMI、PWF
和 ACC 的平均值和标准差.
表 2 节点度对社团检测精度的影响 (均值±标准差)
评价指标 模型 Cornell Texas Washington Wisconsin Cora Citeseer
CGSB 0.2952±0.0608 0.3077±0.0628 0.3271±0.0472 0.3899±0.0774 0.3350±0.0291 0.2936±0.0237
NMI
DCGSB 0.3678±0.0369 0.3244±0.0625 0.3531±0.0283 0.4038±0.0294 0.3645±0.0250 0.3255±0.0253
CGSB 0.4860±0.0749 0.4213±0.0456 0.5142±0.0408 0.5576±0.0408 0.3735±0.0277 0.3936±0.0250
PWF
DCGSB 0.4869±0.0493 0.4715±0.0338 0.5162±0.0221 0.5508±0.0322 0.3879±0.0105 0.4214±0.0221
CGSB 0.5427±0.0781 0.4708±0.0590 0.5321±0.0630 0.5887±0.0543 0.5201±0.0354 0.5119±0.0323
ACC
DCGSB 0.5508±0.0458 0.5155±0.0658 0.5563±0.0280 0.6086±0.0296 0.5389±0.0302 0.5629±0.0287
由表 2 可以看出, 除了在网络 Wisconsin 上, 没有加节点度的 CGSB 模型的 PWF 指标比加了节点度的 DCGSB
模型稍微高了一点外, 其余网络上的 NMI、PWF 以及 ACC 都是加了节点度的 DCGSB 模型比没有加节点度的
CGSB 模型高, 并且在网络 Cornell, Texas, Washington, Wisconsin, Cora 以及 Citeseer 上, DCGSB 模型的 NMI 指标
比 CGSB 模型的 NMI 指标分别提高了 24.59%, 5.43%, 7.95%, 3.57%, 8.81%, 10.87%, 说明引入节点度刻画网络的
无标度特征对社团检测精度是有积极影响的.
为了验证节点度与节点属性之间的关系, 本文在对网络拓扑信息和节点属性建模时, 只在网络拓扑信息中引
入节点度的模型 TGSB 与对两者都引入节点度的模型 DCGSB 进行了对比. 表 3 是两个模型在表 1 所示的 3 个网
络数据集上进行 30 次实验结果的 NMI、PWF 以及 ACC 的平均值和标准差.
表 3 节点度与节点属性之间的关系 (均值±标准差)
评价指标 模型 Cornell Texas Washington Wisconsin Cora Citeseer
TGSB 0.3027±0.0487 0.2377±0.0595 0.2875±0.0277 0.3886±0.0582 0.2353±0.0387 0.2791±0.0290
NMI
DCGSB 0.3678±0.0369 0.3244±0.0625 0.3531±0.0283 0.4038±0.0294 0.3645±0.0250 0.3255±0.0253
TGSB 0.4489±0.0866 0.4028±0.0349 0.4779±0.0484 0.5436±0.0604 0.3111±0.0342 0.3756±0.0256
PWF
DCGSB 0.4869±0.0493 0.4715±0.0338 0.5162±0.0221 0.5508±0.0322 0.3879±0.0105 0.4214±0.0221
TGSB 0.4862±0.0619 0.4219±0.0515 0.5400±0.0624 0.5962±0.0729 0.4510±0.0607 0.5200±0.0222
ACC
DCGSB 0.5508±0.0458 0.5155±0.0658 0.5563±0.0280 0.6086±0.0296 0.5389±0.0302 0.5629±0.0287
由表 3 可以看出, 对网络拓扑信息和节点属性建模时, 两者都引入节点度的 DCGSB 模型各个评价指标都比
只在网络拓扑信息中引入节点度的 TGSB 模型高, 其中在网络 Cornell, Texas, Washington, Wisconsin, Cora 以及
Citeseer 上, DCGSB 模型的 NMI 指标比只在网络拓扑信息中引入节点度的 TGSB 模型分别提高了 21.51%,
36.47%, 22.82%, 3.91%, 54.91%, 16.62 %, 说明在这些网络中节点度与节点属性具有一定的相关性.
5.5 社团检测结果与分析
为了评估模型 DCGSB 的检测精度, 本文在表 1 所示的 3 个网络数据集上进行社团检测实验, 与现有生成模
[9]
型 PCL_DC [27] 、DCSBM 、PPSB [28] 、PSB_PG [20] 、DPSB_PG [21] 以及 ANGM [19] 进行了对比, 并且与经典的社团检
[1]
测算法 SA-Cluster [39] 、In-Custer 、BAGC [40] 以及 BANE [41] 进行了比较. 为了保持实验的公平性, 对比算法的参数
都采用原文献中的最优参数, 实验结果如表 4、表 5 和表 6 所示, 其中红色加粗数值表示 11 个算法中最好的 NMI、
PWF 和 ACC, 黑色加粗表示次好的; BANE 和 ANGM 的数据来自文献 [19]; SA-Cluster、In-Custer、PCL_DC、
PPSB 以及 BAGC 的数据来自文献 [42]; DCSBM 的数据来自文献 [43]. 表 4 是 11 种算法的 NMI 指标, 表 5 是 11
种算法的 PWF 指标, 表 6 是 11 种算法的 ACC 指标. 为了使实验结果更稳定, 我们对每个算法进行了 30 次实验,
给出了 3 个指标 30 次的平均值和标准差.
由实验结果可以看出, 与其他 10 种算法相比, 本文提出的 DCGSB 模型不仅适用于多种网络结构检测, 而且
表现出更好的检测精度和性能. 在含有混合结构的异配网络 (Cornell, Texas, Washington, Wisconsin) 上, NMI 的值
都是最优的. 在网络 Cornell 和 Texas 上, DCGSB 模型的 NMI 值比表现最好的对比算法 DPSB_PG 分别提高了