Page 475 - 《软件学报》2025年第12期
P. 475

5856                                                      软件学报  2025  年第  36  卷第  12  期



                                                                             M  标量乘法
                                                     像素置信度
                                                                             Add  逐元素加法
                            f s
                                                                             Sim 像素相似度计算
                                                                                像素相似度 (0−1)
                                                                     M
                                                Sim

                                                              1−

                            f t                             M       Add

                                                          像素置信度

                                                  图 3 差异筛选模块示意图

                  2.1.2    边界调和模块
                    深层网络中承载着丰富的高级语义信息, 因此, 本文中的语义上下文分支从                        1/32  下采样的特征图中提取和解
                 码图像信息. 然而, 过高的下采样倍率使得语义上下文分支缺乏了细节纹理和边界形状信息, 这影响了其对图像的
                 准确理解. 特别是在物体的边界区域, 分割效果受到了较大的影响, 表现出不足之处.
                    相反, 细节纹理分支以及边缘形状分支则分别保留了空间细节信息和边界形状信息. 因此, 本文提出了借用边
                 界预测调和语义信息和细节纹理信息的合成, 如图                4  所示, 在边缘形状预测     ˜ y e  引导下使用浅层纹理细节信息      f t 填
                 补语义分支    f s 的边界区域信息, 在边界区域上填补更多细节纹理信息, 在其他主体区域上更加信任语义上下文分
                 支. 这一机制不仅丰富了语义分支的特征信息, 还避免了语义分支过度融合细节信息导致的过拟合现象. 该调和模
                 块可以表示为:

                                                                     − →
                                                                − →
                                                  Out merge = f out ((1−v)v s +v· v t )               (2)
                         −
                      v t 、
                         v s  分别表示细节纹理分支和上下文分支的对应像素特征信息, 边缘预测对应像素表示为
                 其中,  − → →                                                                   ν∈[0, 1] (越接
                 近  1  表示越可能是边缘类别), f ou 表示卷积、归一化和         ReLU  的结合.
                                          t

                                                                                      低置信度
                                                                                      中置信度
                                                 M                                    高置信度
                            f t
                                                                                    1  边缘像素
                                              1  1  1  0
                                                                                    0  非边缘像素
                                              1  0  1  0
                                           ~
                                           y e
                                              1  1  1  0
                                              0  0  0  0
                            f s                  M                        Add





                                                     图 4 边界调和模块
   470   471   472   473   474   475   476   477   478   479   480