Page 231 - 《软件学报》2021年第11期
P. 231

欧阳佳  等:面向频繁项集挖掘的本地差分隐私事务数据收集方法                                                  3557


                 多数的频繁项集.(2)  从参数 d 与 m 的角度分析,d 固定,随着 m 的增长,绝对误差会随之降低.这说明 TDC_CLDP
                 在用户拥有较长事务数据的场景会有比更好的表现.
                    从图 10 中可以发现,当固定 d 与 m 时,随着隐私参数的变化,TopK 频繁项集挖掘任务的相对误差没有呈现
                 出明显的趋势,但随 k 变化的整体趋势是相同的.因此可以得出结论:相对误差并不受隐私参数的影响,只随着 d
                 与 m 的变化呈现改变趋势.
















                                         Fig.8  TopK frequent itemset, ε=0.01, d and m vary
                                          图 8  TopK 频繁项集,ε=0.01,d 与 m 取不同值
















                                         Fig.9  TopK frequent itemset, ε=0.1, d and m vary
                                     图 9  TopK 频繁项集,隐私参数固定为 0.1,d 与 m 取不同值
















                                        图 10   TopK frequent itemset, d and m fixed, ε vary
                                     图 10   TopK 频繁项集,固定 d 与 m 不变,隐私参数取不同值
                 5.5   隐私参数设置策略
                    隐私参数是差分隐私模型中的重要参数,本文提出的启发式隐私参数设置策略基于 MPC 攻击模型推断出
   226   227   228   229   230   231   232   233   234   235   236