Page 477 - 《软件学报》2025年第12期

P. 477

5858 软件学报 2025 年第 36 卷第 12 期

− →
− →
− →
− →
p c ( v i,j ∩ v k,l ) ⩾ p c ( v i,j )· p c ( v k,l ) (7)

− → − → − → − → − → − →
˜ p c ( v i,j ∪ v k,l ) ⩽ p c ( v i,j )+ p c ( v k,l )− p c ( v i,j ∩ v k,l ) (8)
虽然得到了联合修改概率上限, 但是邻近像素的正相关性随着距离变近而增强, 简单的假设所有邻近像素相
互独立, 距离越近计算出的联合修正概率偏差越大. 因此, 在假定像素相互独立时, 本文要求邻近像素与给定像素
的距离尽可能相近, 比如在一个 3×3 的邻域中, 所有像素到中心像素的距离是相同的, 这样可以保证相关性的一致
性, 同时所有邻域像素联合修正概率偏差较为一致, 在筛选最大熵的类别联合修正概率较为准确.
具体而言, 如图 6(a) 所示, 考虑每个像素的周围 3×3 像素邻域内的预测来改进每个像素的伪标签, 通过计算
− →
每个类别的邻近像素最大熵作为类别预测, 选择熵最大的类别作为伪标签类别. 给定像素向量 v i.j 及其对应的每
p c ( v i.j ), 考虑每个像素周围 3×3 − → c 的联
v k.l , 计算两个的像素中至少有一个属于类别
− →
个类别预测像素的邻域像素
合概率修正:

− →
− →
− → −→
− →
− →
˜ p c ( v i,j ∪ v k.l ) ⩽ p c ( v i,j )+ p c ( v k.l )− p c ( v i,j , v k.l ) (9)
− →
− →
− → −→
其中, p c ( v i,j , v k,l ) = p c ( v i,j )· p c ( v k,l ) 为像素相互独立的联合概率.

边缘提取
>α
低高
置置
信 <α 信
度 >α 度
正错
确误
预预
测测
>α

类别高置信度
类别中置信度像素置信度可视化表示
(a) 邻近像素融合标签 (b) 交叉伪标签
图 6 交叉融合伪标签

最大增益的邻近预测能够提供周围像素的主要特征信息, 确保置信度更高的信息优先被整合, 因此类别 c 的

联合修正概率需要筛选出具有最大信息熵的邻域修正概率:

− →
− →
M −→
˜ p ( v ) = max( ˜p c ( v ∪ v )) (10)
c i,j i,j k,l
k,l
通过计算所有类别的联合修正概率, 可以得到每个类别对应的最大信息熵. 本文选择具有最大信息熵的类别
作为该像素的伪标签. 虽然在物体边缘区域, 像素容易受到物体外部类别信息的干扰, 从而导致错误类别的信息熵
增大, 但由于空间相关性, 正确类别的邻域像素会产生更大的信息熵, 这有效避免了其他类别的干扰. 此外, 这种方
法还解决了低置信度下正确预测无法被传播的问题.
尽管邻近像素融合优化了分支生成的伪标签, 但这些伪标签仍可能存在某些错误预测, 进而引入不正确的监
督信号, 误导模型训练. 因此本文采用交叉伪标签监督训练无标签图像, 如图 6(b) 所示. 具体而言, 细节纹理分支
f t 和上下文分支 f s 生成的伪标签被用作对方的监督信号, 以避免分支生成自己的监督信号, 从而无法检测自身的

472 473 474 475 476 477 478 479 480 481 482