Page 500 - 《软件学报》2025年第7期
P. 500

张朋飞 等: 基于自适应剪枝的满足本地差分隐私的真值发现算法                                                  3421


                 据  NATURE  算法求得的权重分布距真实分布较为接近. 这是因为根据高质量的数据求得的噪音分布中蕴含的噪
                 音规模较小. 特别地, 图     4(c) 和图  4(d) 中的实验结果也证明了这一现象.

                         1.5                                    0.8
                         1.4     VarFil   PairsTD  TESLA                VarFil   PairsTD  TESLA
                         1.3     TLayer   PrivTDSI  NATURE      0.7     TLayer   PrivTDSI  NATURE
                         1.2                                    0.6
                         1.1                                    0.5
                        MAE Change  0.9                        MAE Change  0.4
                         1.0
                         0.8
                         0.7
                         0.6                                    0.3
                                                                0.2
                         0.5
                         0.4
                                                                0.1
                         0.3
                         0.2                                     0
                          0.01   0.1   0.3   0.5   0.8    1.0    0.01   0.1   0.3   0.5   0.8    1.0
                                           ε                                      ε
                                         (a) Pop                                (b) For
                                                       图 3   ε 的影响

                                                                1.0
                         1.2      VarFil  PairsTD  TESLA                  VarFil  PairsTD  TESLA
                                  TLayer  PrivTDSI  NATURE               TLayer  PrivTDSI  NATURE
                         1.0                                    0.8
                         KL-Divergence  0.8                    KL-Divergence  0.6
                         0.6
                                                                0.4
                         0.2
                                                                0.2
                         2.2
                          0                                      0
                             0.01  0.1  0.3  0.5  0.8   1           0.01  0.1  0.3  0.5  0.8   1
                                           ε                                      ε
                                    (a) Pop: KL-Divergence                 (b) For: KL-Divergence

                         2.8                                    2.8
                                                    TW
                         2.4                        EW                                   TW
                                                                2.4                      EW
                         2.0
                        Weight  1.6                            Weight  2.0
                         1.2
                                                                1.6
                         0.8
                         0.4
                                                                1.2
                          0
                           1    2   3   4    5   6    7   8       1    2   3    4   5   6    7   8
                                          ID                                     ID
                                      (c) Pop: Weight                        (d) For: Weight
                                                   图 4 对权重分布的影响

                    (3) 初始值的影响
                    为了验证在     LDP  约束下, 算法初始值对最终结果的影响, 本文做了如下实验. 第一, 本文进行在不采用                    NATURE
                 中初始值对    CRH  进行初始化和进行初始化的效果对比, NATURE 表示不进行初始化的实验结果, 实验结果如
                                                                     *
                 图  5(a) 和图  5(b) 所示. 第二, 对  NATURE  中随机的初始权重分布分别扩大       1.1–1.5 倍, 算法分别对应   initalization1–
                 initalization5, 实验结果如图  5(c) 和图  5(d) 以及表  2  所示.
   495   496   497   498   499   500   501   502   503   504   505