Page 323 - 《软件学报》2025年第5期
P. 323
王源源 等: 本地差分隐私频率估计伪数据攻击及防御方法 2223
⌊ ⌋
205
205 , 隐私预算 ε = 1.0 时, 设置 k = = 55 . 根据实验数据集参数, 本文评估了 r ⩽ k 时子集选择机制伪数据
1+e 1.0
攻击的效用情况. 这里用 g s-RPA 、 g s-RIA 和 g s-MGA 表示实验中子集选择机制 RPA 攻击、RIA 攻击和 MGA 攻击的实
g w-MGA 表示实验中环机制 RPA 攻击、RIA 攻击和 MGA 攻击的实际效用.
际效用; 用 g w-RPA 、 g w-RIA 和
4.2 攻击实验结果
4.2.1 子集选择机制攻击结果
本文在 SynData 数据集和 IPUMS 数据集上进行了子集选择机制伪数据攻击实验, 图 5 显示了 3 种攻击前后
目标项目的估计频率. 从图 5 中可以看出, RPA 攻击和 RIA 攻击前后目标项目频率估计结果相差不大, 因此, RPA
攻击和 RIA 攻击效果较差. MGA 攻击后目标项目的频率估计结果提高效果比较明显, 攻击效果较好. 为了更好地
展示实验结果, 本文没有对频率估计得到的负值进行处理. 表 4 显示了子集选择机制攻击效用的具体结果, 和第
3.2 节理论分析一致, g s-MGA > g s-RIA > g s-RPA .
0.30 RPA攻击前 0.30 RIA攻击前 0.30
RPA攻击后 RIA攻击后
0.25 0.25 0.25
0.20 0.20 0.20
Frequency 0.15 Frequency 0.15 Frequency 0.15 MGA攻击前
MGA攻击后
0.10
0.10
0.10
0.05 0.05 0.05
0 0 0
−0.05 −0.05 −0.05
0 25 50 75 100 0 25 50 75 100 0 25 50 75 100
Item Item Item
(a) SynData上攻击子集选择机制
0.150 0.150
RPA攻击前 RIA攻击前 0.30
0.125 RPA攻击后 0.125 RIA攻击后
0.25
0.100 0.100
0.20
0.075
0.075
Frequency 0.050 Frequency 0.050 Frequency 0.15 MGA攻击前
MGA攻击后
0.10
0.025
0.025
0.05
0 0
−0.025 −0.025 0
−0.050 −0.050 −0.05
60 000 62 000 64 000 66 000 60 000 62 000 64 000 66 000 60 000 62 000 64 000 66 000
Item Item Item
(b) IPUMS上攻击子集选择机制
图 5 子集选择机制攻击结果
表 4 子集选择机制攻击效用
数据集 g s-RPA g s-RIA g s-MGA
SynData 0.022 0.083 2.839
IPUMS 0.003 0.081 5.734
4.2.2 环机制攻击结果
图 6 显示了在 SynData 数据集和 IPUMS 数据集上进行环机制伪数据攻击的实验结果. 同样, 没有对频率估计
得到的负值进行处理. 表 5 显示了环机制攻击效用的具体结果, 在 SynData 数据集上, g w-RPA = 0.024 g w-RIA =
,