Page 198 - 《软件学报》2024年第4期
P. 198
1776 软件学报 2024 年第 35 卷第 4 期
试和调整策略, 从而最大化长期奖励. 有研究 [25] 将强化学习引入到联邦学习的节点选择任务中, 使用客户端
选择的方式减小通信压力, 但会造成联邦学习训练过程中梯度信息的损失. 状态空间设计是根据模型参数降
维得到模型当前状态, 导致模型状态信息的损失. 构造合适的客户端模型状态, 可以帮助强化学习感知客户
端信息, 更好地学习梯度聚合策略.
公共安全突发事件检测任务的主要难点有:
(1) 在实际应用中, 公共安全数据通常归属于政府、公司或组织, 数据不能在各方之间自由流动, 很难
集中数据去训练事件检测模型; 并且, 公共安全数据通常构造为图数据来处理, 各方图数据的实体
特征与结构都存在 Non-IID 的问题, 传统的联邦学习方法难以学习一个统一的模型帮助各方检测突
发事件;
(2) 现有的个性化联邦图神经网络存在通信量大、性能与通信压力难以平衡的问题, 这为联邦学习梯度
聚合策略提出了更高的要求;
(3) 当采用强化学习来拟合客户端加权与梯度量化策略时, 如何在保护数据隐私的同时, 使智能体准确
地感知客户端状态是十分困难的.
针对上述问题, 本文提出了基于强化联邦图神经网络的个性化公共安全突发事件检测方法, 帮助各客户
端采用多方协作的方式训练个性化的模型, 完成本地公共安全事件检测任务的同时, 在不显著损失模型性能
的前提下, 平衡模型的性能与通信压力.
本文的主要贡献包括:
1) 提出了联邦公共安全突发事件检测模型结构与梯度量化方法, 采用基于图采样的 minibatch 机制的
GraphSage 构造公共安全突发事件检测本地模型, 以减小数据 Non-IID 的影响, 采用梯度量化方法
减小梯度通信的消耗;
2) 提出了基于随机图嵌入的客户端状态感知方法, 采用随机图嵌入的数据原型感知模型联邦训练的
梯度状态, 在保护数据隐私的同时, 更好地保留客户端模型有价值的梯度信息, 帮助强化学习智能
体感知客户端状态信息;
3) 提出了强化联邦图神经网络的个性化梯度聚合与量化策略, 采用深度确定性策略梯度(DDPG)拟合
个性化联邦学习梯度聚合加权策略, 对梯度进行加权后聚合构造本地个性化模型. 根据权重决定是
否对梯度进行量化, 对模型的性能与通信压力进行平衡.
本文第 1 节介绍事件检测、图神经网络、联邦学习和强化学习的研究现状. 第 2 节介绍本文构建的基于
强化联邦图神经网络的个性化公共安全突发事件检测方法. 第 3 节通过对比实验、通信优化实验与消融实验
表明了所提方法的有效性. 第 4 节最后总结全文.
1 相关工作
1.1 事件检测
公共安全突发事件检测是从海量的社交媒体数据中挖掘真实世界的事件 [36] . 社交媒体平台已经成为突发
事件传播的主要媒介, 在社交媒体上的事件通常会吸引带有观点和情感的评论和转发 [15] , 可以帮助决策者更
好地管理危机和做出决策 [1,2] . Allan 等人 [37] 在连续的结构化文本流中发现事件, 实现话题检测与跟踪. 为了更
好地利用实体之间的复杂关联, 研究人员将公共安全数据结构化为图的形式, 既可以保存数据中心众多实体
的信息, 也可以更好地利用实体之间的关联 [4,38] . 图以微博或 Twitter 为实体, 根据实体、时间、地点、评论、
转发和主题构建关联 [39,40] . Peng 等人 [15] 将多种关联与实体通过异质图的结构进行建模, 通过元路径关联实体,
捕获图中的元模式和检测突发事件. 有研究提出了强化的、增量的、跨语言的社会事件检测架构 FinEvent [41] ,
[1]
采用强化学习对图节点进行筛选, 结合空间密度聚类来分析增量数据中的突发事件. Cao 等人 提出了基于知
识保持的增量异质图神经网络 KPGNN, 采用小批量子图采样策略进行可扩展的训练, 并定期删除过时数据
以保持动态嵌入空间. 现有方法缺少在联邦条件下公共安全突发事件检测的相关研究.