Page 502 - 《软件学报》2025年第7期

P. 502

张朋飞等: 基于自适应剪枝的满足本地差分隐私的真值发现算法 3423

为了验证 NWIE 的效果, 本文将其与如下设计的对比算法进行对比. (1) MixImp (mixed importance): 该算法在考虑
两种噪音的情况下, 仅估计任务的重要性. (2) MixEst (mixed estimation): 该算法在考虑两种噪音的情况下, 仅估计
工人的权重. (3) LapImp (Laplace importance): 该算法在仅考虑注入的拉普拉斯的情况下, 同时估计工人的权重和
任务的重要性. (4) GauImp (Gaussian importance): 该算法在仅考虑注入的拉普拉斯的情况下, 同时估计工人的权重
和任务的重要性. 实验结果如图 6 所示.

0.5
MixImp 0.65 MixImp
MixEst 0.60 MixEst
0.4 LapImp LapImp
GauImp 0.55 GauImp
NWIE 0.50 NWIE
MAE Change 0.2 MAE Change 0.45
0.3
0.40

0.1 0.35
0.30
0.25
0 0.20
0.01 0.4 0.3 0.5 0.8 1.0 0.01 0.1 0.3 0.5 0.8 1.0
ε ε
(a) Pop: NWIE 的有效性 (b) For: NWIE 的有效性
图 6 NWIE 有效性

从图 6 中可以看出, (1) MixEst 的效果好于 MixImp, 这说明在 LDP 的约束下, 工人的权重的影响大于工人重
要性的影响, 这是因为在真值发现的过程中, 工人的权重处于主导地位. (2) LapImp 和 GauImp 的效果好于
MixImp 和 MixEst, 这说明同时考虑工人的权重和任务的重要性相对于仅考虑工人的权重和任务的重要性对精度
的提升具有更大的贡献. 这是因为在 NATURE 中需要同时根据工人的权重和任务的重要性来对噪音数据进行剪

枝. (3) GauImp 的效果好于 LapImp, 这说明采用欧氏距离来对噪音数据进行建模的效果好于曼哈顿距离. 这是因
为, 在欧氏距离中采用平方项来对偏差进行建模, 会对偏差按平方放大, 显然其建模效果要好于绝对值项. (4) NWIE
的效果一直最好. 这是因为 NWIE 具有上述所有优点.
(5) UAP 有效性
UAP 主要包括根据工人质量和任务重要性分别进行效用感知自适应剪枝. 因此为了验证 UAP 的效果, 本文
将其与如下设计的对比算法进行对比. (1) Random: 该算法随机剪枝 10% 的工人和任务数据. (2) RanWI (random
weight and importance): 该算法根据工人权重和任务重要性随机剪枝 10% 的工人和任务数据. (3) OnlyI (only
importance): 该算法仅根据任务的重要性对任务数据进行效用感知的自适应剪枝. (4) OnlyW (only weight): 该算法
仅根据工人的权重对工人数据进行效用感知的自适应剪枝. 实验结果如图 7 所示.

0.70 0.5
Random Random
0.65
RanWI RanWI
0.60 OnlyI 0.4 OnlyI
OnlyW OnlyW
MAE Change 0.55 MAE Change 0.3
UAP
UAP
0.50
0.45
0.2
0.40
0.35
0.30 0.1
0.25
0.20 0
0.01 0.4 0.3 0.5 0.8 1.0 0.01 0.4 0.3 0.5 0.8 1.0
ε ε
(a) Pop: UAP 的有效性 (b) For: UAP 的有效性
图 7 UAP 有效性

497 498 499 500 501 502 503 504 505 506 507