Page 189 - 《软件学报》2021年第5期
P. 189
刘文炎 等:可信机器学习的公平性综述 1413
因果公平
特定路径公平
纯干预公平 反事实公平
Fig.8 Relationship between causal fairness definitions
图 8 因果公平定义间的关系
2.3.1 纯干预公平
纯干预公平(purely interventional fairness) [33] 需要输出结果 ˆ y 满足:
ˆ ( P y ) = ˆ ( P y ).
a = 0 a = 1
纯干预定义度量同一群体干预前和干预后的输出结果分布的差异,并要求差异满足:
( P Y = ˆ y |A = ∅ ,O = ∅ ,Π = ∅ )
ln a = 0 ≤ . δ
( P Y = ˆ |A = y ∅ ,O = ∅ ,Π = ∅ )
=
a
1
ˆ ( | =
ˆ ( | =
由于敏感属性通常是因果图的根节点,满足 (P y ˆ a = 0 = 0) =|a P y a 0) 和 (P y ˆ |a = 1) = P y a 1) ,所以纯
1
=
a
干预公平通常比较简单、直观且容易实现.
2.3.2 反事实公平
[8]
反事实公平(counterfactual fairness) 需要输出结果 ˆ y 满足:
ˆ ( P y |, ) =xa ˆ ( P y | ,.xa
)
a = 0 a = 1
该定义度量同一个体或者群体的输出结果在现实世界中和反事实世界中分布的差异,并要求差异满足:
( P Y = ˆ y = , a O = |A , x Π = ∅ )
ln a = 0 ≤ . δ
( P Y = ˆ |A = y , a O = , x Π = ∅ )
a = 1
通过选择 x 的子集作为观察变量 O,反事实公平保护的对象可从个体扩展到群体.但是,因果图的不唯一性
导致反事实公平有不可测试性.
2.3.3 特定路径公平
特定路径公平(path-specific fairness) [33] 需要输出结果 ˆ y 满足:
π
ˆ ( P y a = 0 | ) π = ˆ ( P y a = 1 | ).
该定义度量同一群体在采用不同的特定路径干预后的预测结果的分布的差异,并要求差异满足:
( P Y = ˆ y |A = ∅ ,O = ∅ ,Π = ) π
ln a = 0 ≤ . δ
( P Y = ˆ |A = y ∅ ,O = ∅ ,Π = ) π
1
a
=
特定路径公平可以保留受保护属性带来的合理差异.
表 3 总结比较了各种公平性定义的不同.从受到公平保护对象的角度,可分为个体公平和群体公平.
• 个体公平要求相似个体有相似输出结果,对每个个体做有意义的保证,但是需要对个体间距离度量做
出与任务相关的假设;
• 而群体公平要求少数受保护群体与任务相关的统计分布和所有群体的分布近似相等.
公平机器学习算法的基本任务是,将一般的机器学习算法扩展到保证公平性的算法.本节给出了通用公平
性定义的方式,总结并梳理了现有文献中的 3 类公平性,即感知公平性、统计公平性和因果公平性.