Page 325 - 《软件学报》2025年第5期

P. 325

王源源等: 本地差分隐私频率估计伪数据攻击及防御方法 2225

10 10
RPA RPA RPA RPA
RIA 2.5 RIA RIA 8 RIA
MGA MGA MGA MGA
8 8
2.0
6
6 1.5 6
Gain Gain Gain Gain 4
4 4
1.0
2
2 0.5 2
0 0 0 0
200 400 2 4 0.2 0.4 10 20 30
d ε β r
图 7 子集选择机制参数对攻击效用的影响

4.3.2 参数对环机制攻击效用的影响
对于环机制, 从图 8 可知, 用户数据域 d 增大时, 攻击整体效用不变. 因为环机制可以通过哈希函数把用户数
据域映射到 [0.0, 1.0) 之间, 因此用户数据域 d 对 MGA 攻击整体效用无影响, 第 3.4 节理论分析得到的攻击效用
不含参数 d , 也可证明该结论. 隐私预算 ε 增大, MGA 效用下降. 与子集选择机制 MGA 攻击相同, 假用户比例 β 和
目标项目数量 r 增大时, 环机制 MGA 攻击效用增大. RPA 攻击和 RIA 攻击效用太小, 随参数变化不明显.

3.0 3.0 10
RPA RPA RPA
RIA 10 RIA RIA
2.5 2.5 MGA MGA 8 MGA
8
2.0 2.0
6
RPA 6
Gain 1.5 RIA Gain 1.5 Gain Gain
MGA
4 4
1.0 1.0
0.5 0.5 2 2
0 0 0 0
200 400 2 4 0.2 0.4 10 20 30
d ε β r
图 8 环机制参数对攻击效用的影响

5 攻击防御方法

5.1 后处理

从第 4.2 节的实验结果可看到, LDP 机制估计的项目频率存在负值. 可以对项目频率的估计值进行处理, 使
每个项目的频率估计值都非负, 且项目频率的估计值之和为 1. 数据收集方首先按照 LDP 机制估计每个项目 v
ˆ ˆ
ˆ ¯ f v − f min
的频率 f v ˆ , 然后数据收集方找到最小的项目估计频率 f min , 对每个项目 v 的频率估计值进行校准, 即 f v = ∑ ,
ˆ
ˆ
( f v − f min )
v
¯ 是校准的频率. 攻击整体效用是由攻击后和攻击前目标项目的校准频率之差来计算的. 这样也可以降低频
其中 f v
率增加值, 达到一定的防御效果, 但该防御方法不能识别假用户, 也不能识别攻击者的目标项目.
实验评估了后处理防御方法的有效性, 采用 SynData 数据集, 参数设置与第 4.1 节相同, 实验重复 100 次, 结
果取平均值, 经过后处理的攻击效用如表 6 所示. 表 6 中第 4 列显示了采用后处理前后攻击效用的差值, 可以得

320 321 322 323 324 325 326 327 328 329 330