Page 325 - 《软件学报》2025年第5期
P. 325

王源源 等: 本地差分隐私频率估计伪数据攻击及防御方法                                                     2225



                     10                                         10
                           RPA                         RPA           RPA                  RPA
                           RIA            2.5          RIA           RIA              8   RIA
                           MGA                         MGA           MGA                  MGA
                      8                                          8
                                          2.0
                                                                                      6
                      6                   1.5                    6
                    Gain                  Gain                 Gain                 Gain  4
                      4                                          4
                                          1.0
                                                                                      2
                      2                   0.5                    2
                      0                    0                     0                    0
                          200    400            2      4             0.2    0.4         10    20    30
                              d                     ε                    β                    r
                                            图 7 子集选择机制参数对攻击效用的影响


                 4.3.2    参数对环机制攻击效用的影响
                    对于环机制, 从图      8  可知, 用户数据域   d  增大时, 攻击整体效用不变. 因为环机制可以通过哈希函数把用户数
                 据域映射到    [0.0, 1.0) 之间, 因此用户数据域   d  对  MGA  攻击整体效用无影响, 第      3.4  节理论分析得到的攻击效用
                 不含参数   d , 也可证明该结论. 隐私预算       ε 增大, MGA  效用下降. 与子集选择机制       MGA  攻击相同, 假用户比例      β 和
                 目标项目数量     r 增大时, 环机制   MGA  攻击效用增大. RPA    攻击和   RIA  攻击效用太小, 随参数变化不明显.

                     3.0                  3.0                                        10
                                                       RPA           RPA                  RPA
                                                       RIA      10   RIA                  RIA
                     2.5                  2.5          MGA           MGA              8   MGA
                                                                 8
                     2.0                  2.0
                                                                                      6
                                  RPA                            6
                    Gain  1.5     RIA     Gain  1.5            Gain                 Gain
                                  MGA
                                                                 4                    4
                     1.0                  1.0
                     0.5                  0.5                    2                    2
                      0                    0                     0                    0
                          200    400            2      4             0.2    0.4         10    20    30
                              d                     ε                    β                    r
                                              图 8 环机制参数对攻击效用的影响

                 5   攻击防御方法

                 5.1   后处理

                    从第  4.2  节的实验结果可看到, LDP      机制估计的项目频率存在负值. 可以对项目频率的估计值进行处理, 使
                 每个项目的频率估计值都非负, 且项目频率的估计值之和为                     1. 数据收集方首先按照       LDP  机制估计每个项目      v
                                                                                                ˆ  ˆ
                                                         ˆ                                 ¯    f v − f min
                 的频率   f v ˆ  , 然后数据收集方找到最小的项目估计频率      f min  , 对每个项目   v 的频率估计值进行校准, 即   f v = ∑       ,
                                                                                                     ˆ
                                                                                                  ˆ
                                                                                                 ( f v − f min )
                                                                                                v
                     ¯  是校准的频率. 攻击整体效用是由攻击后和攻击前目标项目的校准频率之差来计算的. 这样也可以降低频
                 其中   f v
                 率增加值, 达到一定的防御效果, 但该防御方法不能识别假用户, 也不能识别攻击者的目标项目.
                    实验评估了后处理防御方法的有效性, 采用               SynData 数据集, 参数设置与第     4.1  节相同, 实验重复   100  次, 结
                 果取平均值, 经过后处理的攻击效用如表             6  所示. 表  6  中第  4  列显示了采用后处理前后攻击效用的差值, 可以得
   320   321   322   323   324   325   326   327   328   329   330