Page 321 - 《软件学报》2025年第5期
P. 321
王源源 等: 本地差分隐私频率估计伪数据攻击及防御方法 2221
3.4 环机制攻击效用
3.4.1 攻击效用评估模型
在环机制中, 根据公式 (11) 可以得到项目 t 的估计频率 f t ˆ , 并且根据公式 (14) 可以得到目标项目 t 的频率增
ˆ ˆ
加值 ∆f t , 因此, 进一步扩展 ∆f t :
1 ∑ n+m 1 ∑ n ∑ n+m ∑ n
˜ ˜ F y (t)− P f F y (t)− P f F y (t) m F y (t)
i
i
ˆ
ˆ
ˆ
∆ f t = f t,b − f t,a = f t,b − P f − f t,a − P f = n+m i=1 − n i=1 = i=n+1 i − i=1 i
P t − P f P t − P f P t − P f P t − P f (n+m)(P t − P f ) n(n+m)(P t − P f )
(27)
y i 是用户 y i 支持项目 F y (t) 输出 1, 否则输出 0. 环机
其中, i 发送给服务器的扰动数据. F y (t) 是计数函数, 当 t 时,
i i
ˆ f t 是项目 t 的真实频率, 因此, 可以得到公式
制中, 项目的频率估计是无偏估计, 即 E[ f t ] = f t , (28):
n
∑
E[F y (t)] = n( f t (P t − P f )+ P f ) (28)
i=1 i
目标项目 t 的频率增加值的期望为:
∑ ∑
n+m n
E[F y (t)] m E[F y (t)]
ˆ
E[∆ f t ] = i=n+1 i − i=1 i (29)
(n+m)(P t − P f ) n(n+m)(P t − P f )
与子集选择机制效用评估模型相同, 公式 (27) 中的第 2 项只取决于真实用户, 将第 2 项表示为常数 c t . 根据
公式 (28) 可以得到:
m( f t (P t − P f )+ P f )
c t = (30)
(n+m)(P t − P f )
因此, 攻击的整体效用如公式 (31) 所示:
∑ n+m ∑
E[F y (t)]
∑ i
ˆ
G = E[∆f t ] = i=n+1 t∈T −c (31)
t∈T (n+m)(P t − P f )
∑ m( f T (P t − P f )+rP f ) ∑
其中, c = c t = , f T = f t , c 与假用户发送到数据收集方的扰动值无关. 攻击的整体效
t∈T (n+m)(P t − P f ) t∈T
用 G 取决于计数函数的期望值 E[F y (t)] .
i
3.4.2 攻击效用
mr[P t +(d −1)P f ]
结论 4. 环机制 RPA 攻击整体效用为 −c .
(n+m)(P t − P f )d
证明: RPA 从用户数据域{1, 2,…, d}中随机选择一个值发送给数据收集方, 因此, 每个目标项目 t 被选中的概
( )
1 1
t
率为 1/d y i 支持项目 的概率为 · P t + 1− · P f . 可以计算出计数函数的期望值, 如公式 (32) 所示:
,
d d
( )
1 1
E[F y (t)] = Pr(F y (t) = 1) = · P t + 1− · P f (32)
i i d d
根据公式 (32), 可以得到攻击整体效用:
∑ mr[P t +(d −1)P f ]
ˆ
G = E[∆f t ] = −c (33)
t∈T (n+m)(P t − P f )d
m[P t +(r −1)P f ]
结论 5. 环机制 RIA 攻击整体效用为 −c .
(n+m)(P t − P f )
证明: 在进行 RIA 攻击时, 用户 i 从目标项目集 T 中随机选择一个项目 t , 进行扰动后向服务器发送扰动值 y i ,
( )
1 1
t
y i 支持项目 的概率为 · P t + 1− · P f . 因此, 可以计算出计数函数的期望值, 如下所示:
r r
( )
1 1
E[F y (t)] = Pr(F y (t) = 1) = · P t + 1− · P f (34)
i i r r
代入公式 (31) 得到攻击整体效用:
∑ m[P t +(r −1)P f ]
ˆ
G = E[∆f t ] = −c (35)
t∈T (n+m)(P t − P f )