Page 225 - 《软件学报》2021年第11期
P. 225
欧阳佳 等:面向频繁项集挖掘的本地差分隐私事务数据收集方法 3551
因为随机变量 P 是 F a 的线性变换,根据离散型随机变量方差的线性运算性质,令 a,b 为常数,
a
2
Var(a⋅X+b)=a ⋅Var(x) (25)
可以将 P 的线性变换整理为
a
P = a 1 ⋅ F − a FPR (26)
n ⋅ (TPR FPR ) TPR FPR
−
−
则 P 的方差为
a
(1 FPR
(1 FPR
() =
a
Var P a n P TPR⋅ a ⋅ ⋅ (1 TPR− ) (n n P+ − ⋅ a ) FPR⋅ ⋅− ) = P TPR⋅ ⋅ (1 TPR− ) (1 P+ − a ) FPR⋅ ⋅− ) (27)
−
−
n ⋅ 2 (TPR FPR ) 2 n⋅ (TPR FPR ) 2
则项分布估计的均方误差为
2
EP − [( a P a ) ] = 2 E [(P − a E [ ]P + a E [ ]P − a P a ) ]
[ ]) ] EEP+
= E [(P − a EP a 2 [ [ ] P− a a ] + 2 2 [(E P − a E [ ]) ( [ ]P a ⋅ E P − a P a )] (28)
= Var () ( [ ]P + a E P − a P a ) 2
公式(23)证明 P 是 P a 的无偏 p 估计,则
a
MSE ()P = a E [(P − a P a ) ] Var= 2 ()P a (29)
则总的均方差为
P TPR ⋅ ⋅ ∑ (1 TPR + ) ( d − P i a ⋅ ∑ ) FPR ⋅ (1 FPR )
−
−
i a
Error Bound = E [(P − ∑ i a P i a ) ] = 2 Var (P i a ) = ∑ i∈ [1, ] d i∈ [1, ] d 2 (30)
−
i∈ [1, ] d i∈ [1, ] d n ⋅ (TPR FPR )
4.2 隐私参数的启发式设置策略
差分隐私模型中,隐私参数用于控制隐私性与效用性,使二者达到平衡.但隐私参数的设置目前没有较好的
指导策略,大多通过实验或者经验来完成.CLDP 隐私模型的最大后验置信度(MPC)攻击模型可定义为
MPC=Pr[v|y] (31)
则 MPC≤ρ有一定的启发式意义,即设置隐私参数为ε,得到的响应结果为 y,通过 y 推断出原始值 v 的风险概率
的上界为ρ;找出ρ与ε的关系后,即可基于具有启发意义的ρ设置隐私参数ε的值.对公式(31)展开,得到公式(32).
α
−⋅ dv
(, )y
e 2
π () Pr[ ( ) v = f ] y π () v ⋅ Ω
v ⋅
MPC = Pr[ | ] y = v =
∑ z CandI π () Pr[ ( ) z = f ] y −⋅ dz
z ⋅
α
(, ) y
2
∈
∑ z CandI π () z ⋅ e
∈
Ω (32)
−⋅ dv (, ) y
α
e 2
π () v ⋅
= Ω = 1
α
−⋅ dv − ⋅ d z ( , ) y π () z α ⋅ ( ( , ) y − d z y
α
( , ))
dv
(, ) y
π () v ⋅ e 2 + ∈ ∑ π ( ) z ⋅ e 2 1+ z CandI z v∈ , ≠ π () v e ⋅ ∑ 2
Ω z CandI ,z v Ω
≠
令所有项集的先验概率π均为1/C k dm ,当 d(x,y)=0,d(z,y)=k 时,d(v,y)−d(z,y)=−k,为最小,则不等式可以变形为
+
1 1
MPC = α (( , )dv y − d ( , ))z y ≤ α⋅ (33)
+
1+ π () z e ⋅ ∑ 2 1(C k − 1) e ⋅ 2 ⋅− k
+
∈
≠
z CandI ,z v π () v dm
又因为 k≤d,则
1 1
MPC ≤ α ≤ α (34)
+
+
1(C dm+ k − 1) e ⋅ 2 ⋅− k 1 (C 1 dm+ − 1) e ⋅ 2 ⋅ − d
令