Page 191 - 《软件学报》2021年第5期
P. 191
刘文炎 等:可信机器学习的公平性综述 1415
3.1.1 基于信息论的公平表征任务
本节从信息论的角度量化分析公平表征任务,从而刻画公平性和效用间的权衡.文献[35]量化分析了统计
均等和不同群体效用之间的平衡,其建立准确率均等(即群体间正确率相等)和几率均等间的关系,证明了一系
列由群体间基本率和均衡错误率(balanced error rate,简称 BER)引导的群体输出结果误差界.当群体间基本率不
同时,证明了任何满足统计均等的分类器至少在一个群体上产生较大的误差.当群体表征间的总变分距离(total
variation distance) [36] 接近时,这种表征满足准确率均等.
CFair 算法 [37] 利用文献[35]的理论,实现了同时满足近似的准确率均等和几率均等的目的.其目标损失和对
抗损失使用均衡错误率,即,对不同群体的分类错误给予同等重视(相同权重),从而提取同时满足近似的准确率
均等和几率均等的公平表征.LAFTR [24] 关联多种统计公平定义与对抗性学习,学习适用于下游分类任务的表
征.CFair [37] 在实现群体间几率均等方面比 LAFTR [24] 更有效,这是因为 LAFTR使用平均绝对误差定义目标函数,
而 CFair 使用渐进有效和最优的交叉熵损失定义目标函数;另外,LAFTR 使用一组对抗惩罚表征中包含的受保
护属性信息,而 CFair 使用两组对抗分别惩罚表征中包含弱势群体的受保护属性信息和非弱势群体的受保护属
性信息,更细致地控制表征的公平程度.
3.1.2 基于生成对抗网络的公平表征任务
本节主要介绍利用深度生成模型并结合因果公平,提高表征可解释性.FairGAN [38] 设计了两个对抗网络,使
得生成网络生成的表征与原数据集相似的同时,不同群体的属性分布也相似.FairGAN +[39] 在 FairGAN 的基础
上,将预测任务添加到学习框架中,再增加一个对抗网络来保证生成数据的分类结果与受保护属性独立.
+
LAFTR、FairGAN、FairGAN 这 3 种算法都可以在预处理阶段实现统计公平,其中,LAFTR 算法是从真实数据
+
学习公平的特征表示,FairGAN 和 FairGAN 算法学习的是随机噪声到公平数据集的映射,可以生成不同规模的
合成数据集.
CFGAN [40] 基于 Causal GAN [41] 学习属性之间的因果关系,使用生成对抗网络促使预测值与反事实世界预
测值相同,从而实现纯干预公平、反事实公平和特定路径公平.CFGAN 学习了属性之间的因果关系,比基于统计
+
公平的表征学习算法 LAFTR、FairGAN、FairGAN 有更好的可解释性.
3.1.3 基于解耦学习的公平表征任务
本节针对下游任务中受保护属性不确定性,应用解耦思想学习公平表征任务.FFVAE 算法 [42] 突破在提取表
征前需要完全确定受保护属性的限制,同时考虑多个受保护属性组合的公平表征任务.其学习目标的奖励项包
括建模非受保护的观测变量、对齐隐变量和受保护属性、将各受保护属性隔离到独立的子空间以及匹配隐变
量和先验分布.从而在测试时,使用单一表征适应各种不同标记和定义的分类任务,实现提取满足统计公平的多
个受保护属性及其组合的公平表征.
除前文调研的公平表征任务外,现有工作 [43] 还基于最优传输理论,利用 Wasserstein 质心技术,以随机方式改
变原始观察到的变量分布.
3.2 公平建模任务
公平建模任务既关心预测准确率,又关注如何减少预测结果的歧视.公平建模任务以符合某种公平性为目
标,调整原有算法获得 f ′,使得 (, ) ⎯⎯→AX f ′ Y .公平建模任务适用于模型提供者对算法模型有完全控制的情况,
公平建模任务重点介入处理中阶段.表 5 总结了公平建模任务的主要信息,且根据机器学习任务的不同,我们将
现有公平建模任务从解决任务的角度进行分类,即分类任务、回归任务、组合优化任务、集成学习任务、图计
算任务和聚类任务等.
Table 5 Fair modeling task
表 5 公平建模任务
目标 输入 输出 公平性 偏差消除机制
算法模型改进 与任务相关的训练样本 公平的机器学习算法模型 统计公平,因果公平 处理中机制