Page 470 - 《软件学报》2025年第12期

P. 470

软件学报 ISSN 1000-9825, CODEN RUXUEW E-mail: jos@iscas.ac.cn
2025,36(12):5851−5870 [doi: 10.13328/j.cnki.jos.007412] [CSTR: 32375.14.jos.007412] http://www.jos.org.cn
©中国科学院软件研究所版权所有. Tel: +86-10-62562563

*
基于差异化特征提取的交叉半监督语义分割网络

陈亚当 1 , 李家戚 1 , 车洵 2 , 吴恩华 3,4

1
(南京信息工程大学计算机学院, 江苏南京 210044)
2
(南京理工大学计算机科学与工程学院, 江苏南京 210094)
(基础软件与系统重点实验室 (中国科学院软件研究所), 北京 100190)
3
4
(计算机科学国家重点实验室 (中国科学院软件研究所), 北京 100190)
通信作者: 车洵, E-mail: chexun@njust.edu.cn
摘要: 半监督语义分割方法通常采用不同数据增强方案来确保多分支网络输入信息的差异化, 以实现分支之间
相互监督. 虽然该方法取了一定成效, 但其存在以下问题: 1) 特征提取差异不足, 造成推理特征信息同化; 2) 监督信
号差异不足, 造成末端损失学习同化. 以上两个问题都会促使网络中不同分支收敛到相似的解决方案, 导致多分支
网络功能退化, 出现多个分支对错误保持相似置信度的问题, 错误引导网络分支收敛. 针对上述问题, 提出了一种
基于差异化特征提取的交叉半监督语义分割网络. 首先, 采用差异化特征提取策略, 通过让网络分支分别关注纹理、
语义和形状等不同信息, 从特征提取角度使特征提取信息始终存在差异性, 减少网络对数据增强的依赖; 其次, 提
出一种交叉融合伪标签方法, 使网络分支交替生成邻域像素融合伪标签, 以此增强网络末端监督信号的差异性, 最
终促使网络分支收敛向不同的解决方案. 实验结果证明, 方法在 Pascal VOC 2012 和 Cityscapes 验证集上分别达到
了 80.2% 和 76.8% 的优异性能, 领先于最新方法 0.3% 和 1.3%.
关键词: 计算机视觉; 语义分割; 半监督学习; 协同训练; 伪标签
中图法分类号: TP391

中文引用格式: 陈亚当, 李家戚, 车洵, 吴恩华. 基于差异化特征提取的交叉半监督语义分割网络. 软件学报, 2025, 36(12):
5851–5870. http://www.jos.org.cn/1000-9825/7412.htm
英文引用格式: Chen YD, Li JQ, Che X, Wu EH. Cross Semi-supervised Semantic Segmentation Network Based on Differential
Feature Extraction. Ruan Jian Xue Bao/Journal of Software, 2025, 36(12): 5851–5870 (in Chinese). http://www.jos.org.cn/1000-9825/
7412.htm

Cross Semi-supervised Semantic Segmentation Network Based on Differential Feature Extraction
1
1
2
CHEN Ya-Dang , LI Jia-Qi , CHE Xun , WU En-Hua 3,4
1
(School of Computer Science, Nanjing University of Information Science and Technology, Nanjing 210044, China)
2
(School of Computer Science and Engineering, Nanjing University of Science and Technology, Nanjing 210094, China)
3
(Key Laboratory of Systems Software (Institute of Software, Chinese Academy of Sciences), Beijing 100190, China)
4
(State Key Laboratory of Computer Science (Institute of Software, Chinese Academy of Sciences), Beijing 100190, China)
Abstract: Semi-supervised semantic segmentation methods typically employ various data augmentation schemes to ensure differentiation in
the input of network branches, enabling mutual self-supervision. While successful, this approach faces several issues: 1) insufficient
diversity in feature extraction leads to feature signal assimilation during inference; 2) inadequate diversity in supervision signals results in
the assimilation of loss learning. These issues cause network branches to converge on similar solutions, degrading the functionality of
multi-branch networks. To address these issues, a cross semi-supervised semantic segmentation method based on differential feature
extraction is proposed. First, a differential feature extraction strategy is employed, ensuring that branches focus on distinct information,
such as texture, semantics, and shapes, thus reducing reliance on data augmentation. Second, a cross-fusion pseudo-labeling method is

* 基金项目: 国家自然科学基金 (62473201, 62477026, 62332015, 62072449); 无锡市产业创新研究院先导技术预研项目
收稿时间: 2024-10-23; 修改时间: 2024-12-09, 2025-01-11; 采用时间: 2025-02-11; jos 在线出版时间: 2025-08-27
CNKI 网络首发时间: 2025-09-08

465 466 467 468 469 470 471 472 473 474 475