Page 258 - 《软件学报》2024年第4期

P. 258

1836 软件学报 2024 年第 35 卷第 4 期

4.3.3 对不同动态变化规模的鲁棒性
在本实验中, 当动态更新∆G 的大小不同时, 我们讨论和分析本文提出的 ED-IDGP 算法的鲁棒性. 我们选择在
数据集 RoadNet-PA 和数据集 Orkut 上做评估, 并且设置分区的数量 k 为 8. 我们设置|∆G|从 20% 到 60%, 其中固
定 10% 的顶点或边的删除, 其他是顶点或边的插入. 在图 14 中展示了在数据集 RoadNet-PA 和数据集 Orkut 上,
不同的动态变化规模|∆G|所对应的标准化边切割 NEC. 从图 14(a) 和图 14(b) 中可知: (1) 在数据集 RoadNet-PA 和
数据集 Orkut 上, Streaming 算法对于所有的动态更新都有着最高的标准化边切割 NEC, 这与前面的实验结果一致.
(2) 在数据集 RoadNet-PA 上, 即使当动态更新规模|∆G|达到 60%, 本文提出的 ED-IDGP 算法有着最低的标准化边
切割 NEC. 类似地, 在数据集 Orkut 上, 与其他算法相比, ED-IDGP 算法始终拥有最低的标准化边切割 NEC. (3) 在
数据集 RoadNet-PA 上, 当|∆G|为 30% 时, ED-IDGP 算法的标准化边切割 NEC 分别比 CCP、IncKGGGP 和
Streaming 低 21.12%、32.57% 和 34.95%. 当|∆G|为 50% 时, ED-IDGP 算法的标准化边切割 NEC 分别比 CCP、
IncKGGGP 和 Streaming 低 26.18%、40.92% 和 43.72%. (4) 对于所有的数据集和不同的动态更新规模|∆G|, ED-IDGP
算法的标准化边切割 NEC 平均比 CCP、IncKGGGP 和 Streaming 低 18.9%、25.19% 和 48.06%.

0.30 0.55
ED-IDGP IncKGGGP CCP
Streaming
0.27 0.50
0.45
0.24 ED-IDGP IncKGGGP CCP
0.40 Streaming
NEC 0.21 NEC 0.35
0.18
0.30
0.15 0.25
0.12 0.20
20 30 40 50 60 20 30 40 50 60
动态更新规模 (%) 动态更新规模 (%)
(a) 在数据集 RoadNet-PA 上的结果 (b) 在数据集 Orkut 上的结果
图 14 不同的动态变化规模所对应的标准化边切割 NEC

4.3.4 分区数量的可收缩性分析
在本实验中, 我们讨论和分析当分区的数量 k 不同时, 本文提出的 IDGP 算法和 ED-IDGP 算法的可收缩性.
我们主要从划分质量和算法效率这两个方面对分区数量的可收缩性进行分析. 首先, 对于划分质量, 从第 4.3.1 节
的实验结果可知: (1) 如图 9 所示, 对于所有的算法, 随着分区的数量 k 增大, 标准化边切割 NEC 也会随着分区的
数量 k 的增大而增大. 这是合理的, 因为当分区的数量 k 增大时, 不同分区之间的通信成本会增加, 即边切割的数
量会增大. 当分区数 k 不同时, 与 CCP、IncKGGGP 和 Streaming 算法相比, ED-IDGP 算法的标准化边切割 NEC
更低或者是可比较的. (2) 如图 11(b) 所示, 在数据集 LiveJournal 上, 当分区数 k 为 4 时, 本文提出的 ED-IDGP 算
法的负载平衡改进值 LBI 分别比 CCP 和 IncKGGGP 高 6.51% 和 36.98%. 当分区数 k 为 16 时, 本文提出的 ED-IDGP
算法的负载平衡改进值 LBI 分别比 CCP 和 IncKGGGP 高 8.13% 和 30.89%. 然后, 对于算法效率, 从第 4.3.2 节的
实验结果可知, 如图 12 所示, 当分区的数量 k 从 2 增大到 16 时, 本文提出的 ED-IDGP 算法的划分时间总体都呈
下降趋势.
4.4 算法在分布式图计算任务中的效果分析
为了评估本文提出的 ED-IDGP 算法与其他比较方法相比在分布式图计算任务中的性能, 我们选用在图划分
领域中常见的用于评估图划分算法性能的两个图计算任务网页排名计算 (PageRank) 和单源最短路径 (SSSP). 我
们首先将 ED-IDGP、CCP、IncKGGGP 和 Streaming 算法得到的图发生动态变化后 G+∆G 的划分结果 P 作为输
′
入导入到分布式图处理系统 Giraph 中, 然后在 Giraph 平台上运行分布式图计算任务 PageRank 和 SSSP. 在本次实

253 254 255 256 257 258 259 260 261 262 263