Page 225 - 《软件学报》2021年第11期
P. 225

欧阳佳  等:面向频繁项集挖掘的本地差分隐私事务数据收集方法                                                  3551



                    因为随机变量 P 是 F a 的线性变换,根据离散型随机变量方差的线性运算性质,令 a,b 为常数,
                                 a
                                                             2
                                                   Var(a⋅X+b)=a ⋅Var(x)                              (25)

                    可以将 P 的线性变换整理为
                           a
                                             P =    a  1    ⋅  F −  a  FPR                           (26)
                                                 n ⋅  (TPR FPR )  TPR FPR
                                                       −
                                                                    −

                 则 P 的方差为
                    a
                                                                                           (1 FPR
                                                         (1 FPR
                      () =
                                                                   a
                    Var P   a  n P TPR⋅  a  ⋅  ⋅ (1 TPR−  ) (n n P+  − ⋅  a ) FPR⋅  ⋅−  )  =  P TPR⋅  ⋅ (1 TPR−  ) (1 P+  −  a ) FPR⋅  ⋅−  )   (27)
                                                                                  −
                                              −
                                       n ⋅  2  (TPR FPR ) 2                 n⋅  (TPR FPR ) 2
                 则项分布估计的均方误差为
                                                             2
                              EP −  [(     a  P a ) ] =  2  E [(P −     a  E [ ]P +     a  E [ ]P −     a  P a ) ]
                                                [ ]) ] EEP+
                                        =  E [(P −     a  EP    a  2  [ [ ] P−     a  a ] +  2  2 [(E P −     a  E [ ]) ( [ ]P    a  ⋅  E P −     a  P a )]  (28)
                                        =  Var () ( [ ]P +     a  E P −     a  P a ) 2

                    公式(23)证明 P 是 P a 的无偏 p 估计,则
                                a
                                               MSE ()P =     a  E [(P −     a  P a ) ] Var=  2  ()P    a  (29)
                 则总的均方差为
                                                             P TPR ⋅ ⋅ ∑  (1 TPR +  )  ( d −  P i a ⋅ ∑  )  FPR ⋅  (1 FPR )
                                                                                             −
                                                                      −
                                                               i a
                    Error Bound =  E [(P − ∑     i a  P i a  ) ] =  2  Var (P    i a  ) = ∑  i∈ [1, ] d  i∈ [1, ] d  2   (30)
                                                                              −
                               i∈  [1, ] d    i∈  [1, ] d               n ⋅  (TPR FPR )
                 4.2   隐私参数的启发式设置策略
                    差分隐私模型中,隐私参数用于控制隐私性与效用性,使二者达到平衡.但隐私参数的设置目前没有较好的
                 指导策略,大多通过实验或者经验来完成.CLDP 隐私模型的最大后验置信度(MPC)攻击模型可定义为
                                                      MPC=Pr[v|y]                                    (31)
                 则 MPC≤ρ有一定的启发式意义,即设置隐私参数为ε,得到的响应结果为 y,通过 y 推断出原始值 v 的风险概率
                 的上界为ρ;找出ρ与ε的关系后,即可基于具有启发意义的ρ设置隐私参数ε的值.对公式(31)展开,得到公式(32).
                                                                       α
                                                                      −⋅ dv
                                                                        (, )y
                                                                     e  2
                                           π () Pr[ ( ) v =  f  ] y  π () v ⋅  Ω
                                             v ⋅
                          MPC =  Pr[ | ] y =  v             =
                                        ∑ z CandI  π () Pr[ ( ) z =  f  ] y  −⋅ dz
                                                z ⋅
                                                                          α
                                                                            (, ) y
                                                                           2
                                          ∈
                                                             ∑  z CandI π () z ⋅  e
                                                                ∈
                                                                          Ω                          (32)
                                                −⋅ dv (, ) y
                                                 α
                                               e  2
                                           π () v ⋅
                                    =             Ω              =            1
                                                           α
                                      −⋅ dv                − ⋅ d z ( , ) y   π () z  α  ⋅ ( ( , ) y − d z y
                                      α
                                                                                         ( , ))
                                                                                    dv
                                        (, ) y
                                π  () v ⋅  e  2  +  ∈ ∑  π  ( ) z ⋅  e  2  1+  z CandI z v∈  , ≠  π () v  e ⋅ ∑  2
                                       Ω       z CandI ,z v  Ω
                                                    ≠
                    令所有项集的先验概率π均为1/C           k dm  ,当 d(x,y)=0,d(z,y)=k 时,d(v,y)−d(z,y)=−k,为最小,则不等式可以变形为
                                               +
                                                     1                      1
                                   MPC =                 α  (( , )dv y −  d ( , ))z y  ≤  α⋅         (33)
                                                                      +
                                         1+         π () z  e ⋅ ∑  2  1(C k  −  1) e ⋅  2 ⋅− k
                                                                          +
                                              ∈
                                                  ≠
                                             z CandI ,z v  π () v        dm
                    又因为 k≤d,则
                                                     1                1
                                         MPC ≤            α  ≤             α                         (34)
                                                                +
                                                +
                                               1(C dm+  k  −  1) e ⋅  2 ⋅−  k  1 (C 1 dm+  −  1) e ⋅  2 ⋅  −  d
                    令
   220   221   222   223   224   225   226   227   228   229   230