Page 188 - 《软件学报》2021年第5期
P. 188
1412 Journal of Software 软件学报 Vol.32, No.5, May 2021
( P Y = ˆ | = y a 0,O = , y Π = ∅ )
ln ≤ . δ
( P Y = ˆ | = y a 1,O = ,Π =y ∅ )
精度统计公平的代表性定义有几率均等、机会均等和待遇均等,其定义如下:
如果输出结果 ˆ y 和受保护属性 a 在给定标记 y 时条件独立,那么 ˆ y 满足关于 a 和 y 的几率均等(equalized
odds/positive rate parity) [15] ,即
ˆ ( P y = 1| = a 0, ) = y ˆ ( P y = 1| = a 1, ).
y
如果我们有:
⎛ a 0⎞ ⎛ = a = 1⎞
P ⎜ ˆ = 1 = P ⎜ ˆ = ⎟ y 1 ⎟ y ,
⎝ y = 1 ⎠ ⎝ y = 1 ⎠
那么输出结果 ˆ y 满足关于受保护属性 a 和标记 y 的机会均等(equal opportunity/true positive rate parity) [15] .
如果我们有:
⎛ = 0⎞ ⎛ a a = 1⎞
P ⎜ ˆ = 0 = P ⎜ ˆ = ⎟ y 0 ⎟ y ,
⎝ y = 1 ⎠ ⎝ y = 1 ⎠
且同时满足
⎛ a 0⎞ ⎛ = a = 1⎞
P ⎜ ˆ = 1 = P ⎜ ˆ = ⎟ y 1 ⎟ y ,
⎝ y = 0 ⎠ ⎝ y = 0 ⎠
那么输出结果 ˆ y 满足关于受保护属性 a 和标记 y 的待遇均等(treatment equality) [28] .
几率均等要求受保护和不受保护群体输出结果的真阳率和假阳率是相等的.机会均等更关心真阳率,也就
是每个群体中正向类别的成员有正向结果的概率.机会均等同几率均等一样,在输出结果中引入标记的信息.但
是标记本身可能是有偏的,该定义无法缩小不同群体间的差异.进一步,待遇均等以相同思路分析均等问题,其
同时考虑不同群体输出结果的假阳率和假阴率.
2.2.3 校准统计公平
校准统计公平 [29] 度量每个群体输出结果的置信度的差异,并要求差异满足:
( P Y = | = y a 0,O = ˆ, y Π = ∅ )
ln ≤ . δ
( P Y = | = y a 1,O = ˆ,Π =y ∅ )
校准统计公平的代表性定义有测试均等,其定义如下:
如果标记 y 和受保护属性 a 在给定输出结果 ˆ y 时条件独立,即
( P y = 1| = a 0, y ˆ) = ( P y = 1| = a 1, y ˆ),
那么 y 满足关于 a 和 ˆ y 的测试均等(test fairness/predictive rate parity) [30] .
该定义反映群体属于正向类别(y=1)的概率相等.
2.3 因果公平性
因果公平性是基于因果模型 [31] 的公平性定义,通过干预因果模型,研究受保护属性对输出结果的影响,并消
除该影响.因果图模型是表示属性间因果关系的有向无环图,因果图中,节点表示属性,箭头表示因果关系,代表
因的属性节点指向代表果的属性节点.因果图中常常使用 do 操作来得到干预后的因果图,例如,干预受保护属
性A意味着:删除原因果图中所有指向A的箭头,并且对A赋值,从而得到干预后的因果图.通常使用 do(a=0)表示
对A进行干预,且对属性A赋值为 0.
因果公平与统计公平不同,它并不完全由观察到的数据驱动,还需要引入额外的因果关系假设.因果图模型
存在局限性,其结构本身来自于领域知识,可能出现假设不一致的情况;另外,基于观测数据,因果图模型通常存
在模型不唯一的情况.在某些特定的情况下,受保护属性导致的偏差不一定是不公平的 [32] .因果公平可以有针对
性地消除系统中不公平的影响,同时保留公平的部分.因果公平会使用到这些符号: Y ˆ 表示干预为 do(a=0)的
a = 0
标签预测值,do(a=1)的标签预测值,π表示指定的因果路径.图 8 表示因果公平定义间的关系.