Page 207 - 《软件学报》2024年第4期
P. 207
管泽礼 等: 基于强化联邦 GNN 的个性化公共安全突发事件检测 1785
(a) p c=1 (b) p c=0.8
图 3 在 Weibo 数据集中模型收敛性分析
实验结果表明, PPSED 是所有方法里面效果最好、稳定性较高的方法.
3.4 通信优化实验
为了探索客户端参与联邦聚合的比例 p c 和客户端梯度量化的比例 p q 对模型准确率和通信成本的影响, 本
实验在 Weibo 数据集上, 将客户端数量设置为 5, p c 设置为 1, 0.8 和 0.5, p q 设置为 1, 0.7 和 0.4, 分别进行实验,
实验结果见表 6.
表 6 在数据集 Weibo 上的通信优化实验
p c=1 p c=0.8 p c=0.5
p q
准确率 通信成本(MB) 准确率 通信成本(MB) 准确率 通信成本(MB)
1 0.734 9 12.5 0.718 5 10 0.703 5 7.5
0.7 0.710 3 11.3 0.710 4 8.8 0.675 4 6.3
0.4 0.685 6 8.9 0.670 3 7.6 0.652 8 5.1
实验结果表明, p c 与 p q 的值与模型准确率的关系相似. p c 与 p q 的值更接近于 1, 也就是所有的客户端都参
与到联邦聚合中, 并且不需要量化时, 模型的准确率是最高的, 但通信成本也相应最大. 降低 p c 与 p q 的值, 虽
然模型准确率有所下降, 但通信成本也相应减小. 这意味着: 在这个实验中, 降低客户端的参与比例可以有
效地降低通信成本, 但这同时也会对模型准确率造成一定的影响. 从结果可以看到: 当 p q =0.7, p c =0.8 时, 通
信成本减少 30%, 准确率只下降了 3.4%; 当 p c =0.5, p q =0.4 时, 通信成本降低了 59%, 准确率下降了约 11%. 这
个结果表明: 在带宽有限或者通信成本高昂的场景下, 可以通过适当降低客户端的参与比例和增加梯度量化
的比例, 来有效地减少通信成本, 尽管这可能会对模型的准确率产生一些影响. 然而, 相比通信成本的大幅降
低, 模型准确率的下降在可接受的范围内, 这是一个非常值得考虑的优化策略. 实验结果表明, PPSED 可以有
效地通过调节 p c 与 p q 的值来平衡模型性能与通信压力.
3.5 消融实验
为了充分验证本文中每个组件的有效性, 在以数据集 Weibo 为例进行消融实验. 实验结果如图 4 所示, 其
中, 图 4(a)是参与聚合的客户端比例 p c 设置为 1 的结果, 图 4(b)是参与聚合的客户端比例 p c 设置为 0.8 的结
果. 从实验结果可以看出, 每个组件的改进都带来了性能的提升, 验证了在实验中使用的每个组件的有效性.
FedAvg+sage 是基础全采样方法, 提供了实验的基线性能. FedAvg+sage-P 是在 FedAvg+sage 的基础上添加了
minibatch 机制的图采样方法, 在所有设置下的性能都超过了基础方法. 这表明, minibatch 机制的图采样方法
.
对于性能的提升是有效的. FedAvg+sage-L 在 FedAvg+sage-P 的基础上添加了降维的方法. FedAvg+sage-L 在所
有情况下的性能都超过了 FedAvg+sage-P, 这说明降维方法能够有效剔除高维特征中的冗余信息, 保留了更加
关键的信息. PPSED 在 FedAvg+sage-L 的基础上添加了强化学习 DDPG, 并在梯度聚合前根据客户端状态评
估重要性对梯度进行加权. PPSED 在所有情况下的性能都超过了 FedAvg+sage-L, 这表明强化学习 DDPG 和
基于客户端状态的梯度加权策略能够进一步提升模型的性能. 消融实验结果展示了每个组件对于模型性能的
重要性. 强化学习 DDPG 和基于客户端状态的梯度加权策略取得了显著的性能提升.