Page 472 - 《软件学报》2025年第9期

P. 472

李军侠等: 基于语义调制的弱监督语义分割 4383

3.5.2 MS COCO 2014
表 8 给出了本文方法在 MS COCO 2014 验证集上与其他方法的分割性能比较结果. 其中, I 表示图像级标签,
S 表示显著性图, 粗体标记最佳结果. 本文方法获得了 42.3% 的 mIoU, 相比于其他的一些最新方法, 例如 LPCAM [30]
和 OCR [49] , 所提方法得到了与他们类似的结果.

表 8 本文方法与其他方法在 MS COCO 2014 验证集上分割结果比较 (%)

方法会议监督信息验证集mIoU 方法会议监督信息验证集mIoU
EDAM [32] CVPR 2012 I+S － AMN [42] CVPR 2022 I 44.7
EPS [36] CVPR 2021 I+S 35.7 W-OoD [43] CVPR 2022 I －
InferCAM [37] WACV 2022 I+S － SIPE [44] CVPR 2022 I 43.6
RCA [38] CVPR 2022 I+S 36.8 ViT-PCM [45] ECCV 2022 I 45.0
L2G [19] CVPR 2022 I+S 44.2 AEFT [46] ECCV 2022 I 44.8
Mat-Label [35] ICCV 2023 I+S 45.6 ToCo [23] CVPR 2023 I 41.3
SEAM [6] CVPR 2020 I 31.9 ACR [47] CVPR 2023 I 45.3
CDA [39] ICCV 2021 I 33.2 BECO [48] CVPR 2023 I 45.1
URN [40] AAAI 2022 I 40.7 CLIP-ES [29] CVPR 2023 I 45.4
MCTformer [14] CVPR 2022 I 42.0 LPCAM [30] CVPR 2023 I 42.8
ReCAM [41] CVPR 2022 I － OCR [49] CVPR 2023 I 42.5
CLIMS [31] CVPR 2022 I －本文方法－ I 42.3

同时, 图 8 给出了本文方法在验证集上的分割结果示例, 从图 8 可以很清楚地看到, 与 CLIP-ES [29] 相比, 本文
方法在分割物体的细节处理方面表现更好, 如图 8 第 1 行中人的手部, 第 2 行中长颈鹿的头部, 与 MCTformer [14]
相比, 本文方法在分割物体的完整性方面表现更好, 如图 8 第 3 行中人的头部.

(a) 原图 (b) MCTformer (c) CLIP-ES (d) Ours (e) 真实标签

图 8 MS COCO 2014 验证集上的分割结果

3.6 局限性与不足
本文所提方法虽然取得了目前较为先进的性能, 但是在一些具有挑战性的场景中仍然存在局限性与不足. 例

467 468 469 470 471 472 473 474 475 476 477