Page 502 - 《软件学报》2025年第7期
P. 502

张朋飞 等: 基于自适应剪枝的满足本地差分隐私的真值发现算法                                                  3423


                 为了验证   NWIE  的效果, 本文将其与如下设计的对比算法进行对比. (1) MixImp (mixed importance): 该算法在考虑
                 两种噪音的情况下, 仅估计任务的重要性. (2) MixEst (mixed estimation): 该算法在考虑两种噪音的情况下, 仅估计
                 工人的权重. (3) LapImp (Laplace importance): 该算法在仅考虑注入的拉普拉斯的情况下, 同时估计工人的权重和
                 任务的重要性. (4) GauImp (Gaussian importance): 该算法在仅考虑注入的拉普拉斯的情况下, 同时估计工人的权重
                 和任务的重要性. 实验结果如图         6  所示.

                         0.5
                                                    MixImp      0.65                        MixImp
                                                    MixEst      0.60                        MixEst
                         0.4                        LapImp                                  LapImp
                                                    GauImp      0.55                        GauImp
                                                    NWIE        0.50                        NWIE
                        MAE Change  0.2                        MAE Change  0.45
                         0.3
                                                                0.40

                         0.1                                    0.35
                                                                0.30
                                                                0.25
                          0                                     0.20
                             0.01  0.4  0.3  0.5  0.8  1.0          0.01  0.1  0.3  0.5   0.8  1.0
                                           ε                                      ε
                                   (a) Pop: NWIE 的有效性                      (b) For: NWIE 的有效性
                                                     图 6 NWIE  有效性

                    从图  6  中可以看出, (1) MixEst 的效果好于    MixImp, 这说明在   LDP  的约束下, 工人的权重的影响大于工人重
                 要性的影响, 这是因为在真值发现的过程中, 工人的权重处于主导地位. (2) LapImp                       和  GauImp  的效果好于
                 MixImp  和  MixEst, 这说明同时考虑工人的权重和任务的重要性相对于仅考虑工人的权重和任务的重要性对精度
                 的提升具有更大的贡献. 这是因为在           NATURE  中需要同时根据工人的权重和任务的重要性来对噪音数据进行剪

                 枝. (3) GauImp  的效果好于  LapImp, 这说明采用欧氏距离来对噪音数据进行建模的效果好于曼哈顿距离. 这是因
                 为, 在欧氏距离中采用平方项来对偏差进行建模, 会对偏差按平方放大, 显然其建模效果要好于绝对值项. (4) NWIE
                 的效果一直最好. 这是因为        NWIE  具有上述所有优点.
                    (5) UAP  有效性
                    UAP  主要包括根据工人质量和任务重要性分别进行效用感知自适应剪枝. 因此为了验证                            UAP  的效果, 本文
                 将其与如下设计的对比算法进行对比. (1) Random: 该算法随机剪枝                10%  的工人和任务数据. (2) RanWI (random
                 weight and importance): 该算法根据工人权重和任务重要性随机剪枝            10%  的工人和任务数据. (3) OnlyI (only
                 importance): 该算法仅根据任务的重要性对任务数据进行效用感知的自适应剪枝. (4) OnlyW (only weight): 该算法
                 仅根据工人的权重对工人数据进行效用感知的自适应剪枝. 实验结果如图                        7  所示.


                         0.70                                    0.5
                                                     Random                                 Random
                         0.65
                                                     RanWI                                  RanWI
                         0.60                        OnlyI       0.4                        OnlyI
                                                     OnlyW                                  OnlyW
                        MAE Change 0.55                         MAE Change  0.3
                                                                                            UAP
                                                     UAP
                         0.50
                         0.45
                                                                 0.2
                         0.40
                         0.35
                         0.30                                    0.1
                         0.25
                         0.20                                     0
                              0.01  0.4  0.3  0.5  0.8  1.0         0.01  0.4  0.3  0.5   0.8  1.0
                                            ε                                     ε
                                     (a) Pop: UAP 的有效性                      (b) For: UAP 的有效性
                                                     图 7 UAP  有效性
   497   498   499   500   501   502   503   504   505   506   507