Page 334 - 《软件学报》2020年第11期
P. 334
李阳 等:基于对象位置线索的弱监督图像语义分割方法 3649
Fig.4 Visual segmentation results of the attention map and pseudo pixel-level annotations
图 4 注意力图及伪像素标注的可视化分割结果
Fig.5 Saliency maps obtained by successive erasing method based on WSS and DHSN saliency network
图 5 基于 WSS 和 DHSN 显著网络的逐次擦除法获取的显著图
3.3 全连接条件随机场优化的有效性
为了验证条件随机场模型可以有效地检测到图像对象的轮廓从而提升分割的准确率,本次实验对第 3.2 节
的实验结果通过 dense CRF 模型进一步优化.第 2.5 节已经给出了 dense CRF 的详细描述,由于第 3.2 节的实验
结果指定了每个像素的标签(label(y n )),而非每个像素属于 21 个语义类别的概率,因此本实验将公式(6)的第一
项φ(y n )改为
⎧ λ , if c = label ( )y n
φ (y = ) c = ⎪ (1 λ − ⎨ )/ | Z |, if c ≠ label ( ) andy c∈ { , }Z c (10)
n n 0
⎪
⎩ 0, otherwise
其中,λ∈(0.5,1),表示 y n =c 的概率.实验中,我们设定λ={0.7,0.8,0.9,0.98}.表 3 给出了在不同λ值的情况下 dense
CRF 优化的分割结果.
从表 3 可以看出,随着λ增加,这两个方法的平均 IoU 值均呈上升趋势.这就说明当λ值增加时,我们给予通过
融合显著图 S 2 与注意力图所生成的伪像素标注的置信度越高,从而通过 dense CRF 优化得到更准确的分割结
果.对于方法“DHSN [28] _S 2 _AM”,当λ={0.7,0.8,0.9}时,其平均 IoU 值均小于没有加入 dense CRF 优化过程的分割
结果;特别是当λ=0.7 时,其平均 IoU 值为 51.45%,比无 dense CRF 优化过程的 55.14%要小近 4 个百分点.而当
λ=0.98 时,其分割结果才有所提升(56.03%).这说明基于 DHSN 模型的逐次擦除法及融合算法 2 获取的伪像素
标签比较准确,需要在 dense CRF 模型中给与较高的置信度(即属于该标签的概率更高),才能充分地发挥 dense