Page 487 - 《软件学报》2025年第7期

P. 487

3408 软件学报 2025 年第 36 卷第 7 期

群智感知更容易受到 DPA 的问题, 设计了基于差分进化算法的梯度代替方法.
与此同时, 研究者们也往往面向联邦学习场景设计投毒攻击和防御方法. 为了防御模型投毒攻击 (model
poisoning attack, MPA), Hossain 等人 [35] 基于强化学习为本地客户模型选择不同的隐私级别, 从而平衡模型泄露和
集成模型的效用. Zhong 等人 [36] 基于拜占庭鲁棒设计了一种基于统计的防御方法, 以消除特征层面的异常干扰. 进
一步地, Huang 等人 [37] 通过服务器验证被差分隐私噪音扰动的模型参数, 检测发现集中模型中的有毒参数和恶意
用户.
尽管 LDP 协议中的投毒攻击与防御问题和本文研究均是为了获取正确的统计信息, 然而二者的问题场景和
采用技术却有较大区别. 就问题场景而言, 投毒攻击和防御是针对“恶意值”的场景, 其中部分工人是恶意的, 其采
用 LDP 技术是为了隐藏自身的恶意提交值, 可能并不会严格遵守 LDP 协议. 同时, 这些提交这些“恶意值”是为了
破坏服务器收集的统计信息, 这些值可能并不具备较大取值范围, 也就是说投毒防御的目的是识别精心构造的虚
假值. 与之不同的是, 本文针对的是“异常值”场景, 其中工人会严格遵守 LDP 协议, 提交值具有大的取值范围, 本
研究是为了在满足 LDP 保护的注入噪音就较大情况下得到精确的任务“真值”. 就采用技术而言, 投毒攻击与防御
往往需要攻击者与防御者具有一定背景知识, 比如投毒者的数量, 或者操纵的一系列的其他工人的提交值. 与之不
同的是, 本文同时考虑为满足 LDP 保护注入的拉普拉斯噪音和表示工人质量的高斯噪音, 在不需要背景知识的情
况下自适应剪枝掉“异常值”并获得最终任务的“真值”.

1.2 基于密码学的真值发现

Zhang 等人 [38] 针对不同场景提出了两种可靠的真值发现方法: 第 1 种是针对工人位置相对稳定的场景, 他们
应用 Paillier 同态加密、单向哈希链和超增序列等技术来实现隐私保护, 第 2 种是针对工人经常移动的场景主要
采用 Paillier 同态加密来实现隐私保护. Xue 等人 [39] 提出了一种基于激励机制的隐私保护真值发现方法, 其结合同
态加密系统在两个非串谋服务器下, 引入基于权重的激励机制, 既保证了更强的安全性能, 又确保计算效率和性
能. Zhao 等人 [40] 提出一种基于边缘计算范例的轻量级、健壮的匿名机制. 该方法通过异常值检测来消除异常值的
影响, 以实现真值发现结果的鲁棒性. Wu 等人 [41] 提出了两种真值发现方法: 一种是基础隐私感知真值发现方法,
另一种是具有两台服务器的隐私增强真值发现方法, 同时兼顾隐私性和实用性. Tang 等人 [42] 提出了匿名化真值发
现方法, 将工人与他们的数据断开链接, 其中工人的数据无需复杂的加密即可计算和传输, 还借助扰动技术提出了
一种更轻量级的真值发现方法, 以在工人愿意公开权重的场景中进一步减少每个工人的开销. Zhang 等人 [43] 基于
矩阵计算特性, 设计了基于密钥推导和 (重新) 加密机制的新方法, 以在真值发现过程中同时保护用户的任务隐私
和数据隐私. Liu 等人 [44] 提出一种协作式云加密的隐私保护真值发现系统架构, 该架构在利用乱码电路的同时适
应双云对等模型. Xiong 等人 [45] 基于秘密共享和加性同态特性提出一种去中心化的隐私保护框架. Liu 等人 [46] 进
一步结合数据掩码来解决时空关联下的真值发现问题.
由于本文采用 LDP 来保护工人数据, 并不涉及任何密码学相关内容, 因此这些优秀成果和本文的研究内容
正交.

1.3 满足 LDP 的真值发现
国内外针对满足 LDP 的真值发现研究尚处于起步阶段. 现有研究主要针对不同的数据类型展开满足 LDP 的
真值发现工作.
针对离散值的情况, Sun 等人 [24] 基于随机响应机制提出一种面向个性化激励的真值发现算法, 然而该算法只
能适用于二值属性. Li 等人 [47] 提出一种分层的 LDP 的真值发现算法. 其中首先从超分布中采样一个概率, 然后基
于此概率调用随机响应机制来扰动工人数据. Wang 等人 [48] 提出一种仅保护部分属性的新方法.
针对连续值的情况, Sun 等人 [22] 针对稀疏众包场景, 首先定义了非严格的 LDP 范式 Cell-LDP, 在此基础上提
出了基于矩阵分解的新方法. 与文献 [47] 类似, Li 等人 [23] 结合高斯机制提出了分层的真值发现方法. 由于采用高
斯机制, 该方法仅满足 (ε,δ)-LDP. 为了处理个性化激励的场景, Sun 等人 [25] 首先定义了非严格的 LDP 范式 KL-

482 483 484 485 486 487 488 489 490 491 492