Page 231 - 《软件学报》2021年第11期
P. 231
欧阳佳 等:面向频繁项集挖掘的本地差分隐私事务数据收集方法 3557
多数的频繁项集.(2) 从参数 d 与 m 的角度分析,d 固定,随着 m 的增长,绝对误差会随之降低.这说明 TDC_CLDP
在用户拥有较长事务数据的场景会有比更好的表现.
从图 10 中可以发现,当固定 d 与 m 时,随着隐私参数的变化,TopK 频繁项集挖掘任务的相对误差没有呈现
出明显的趋势,但随 k 变化的整体趋势是相同的.因此可以得出结论:相对误差并不受隐私参数的影响,只随着 d
与 m 的变化呈现改变趋势.
Fig.8 TopK frequent itemset, ε=0.01, d and m vary
图 8 TopK 频繁项集,ε=0.01,d 与 m 取不同值
Fig.9 TopK frequent itemset, ε=0.1, d and m vary
图 9 TopK 频繁项集,隐私参数固定为 0.1,d 与 m 取不同值
图 10 TopK frequent itemset, d and m fixed, ε vary
图 10 TopK 频繁项集,固定 d 与 m 不变,隐私参数取不同值
5.5 隐私参数设置策略
隐私参数是差分隐私模型中的重要参数,本文提出的启发式隐私参数设置策略基于 MPC 攻击模型推断出