Page 104 - 《渔业研究》2025年第6期
P. 104

第 6 期                陈红梅等: 基于      Res-PGAUnet 的沿海养殖池塘遥感提取研究                           795

              大,分布有河道和盐田等干扰地物。                                 7∶2∶1  比例将    4 800  张影像随机划分为训练集、
                  本研究收集了       6  景范围覆盖旧镇湾、东山湾及                验证集和测试集。在模型训练过程中,对训练集中
              诏安湾的     GF-2 PMS  遥感影像,用于制作模型训                  的图像进行水平翻转、旋转和椒盐噪声等数据增强
              练、验证、测试数据集。对影像进行辐射定标、大                           操作。为验证模型在大范围养殖区提取的泛化性
              气校正、正射校正、图像融合等预处理后,使用                            能,选取    3  景范围包括诏安湾、宫口湾的           GF-2 PMS
              ArcGIS  制作标签,按      256×256  像素大小、0%    重叠       高分辨率遥感影像进行辐射定标、大气校正、正射
              率进行裁剪,筛除标签占比小于              30%  的数据,总计          校正、图像融合等预处理,制作标签得到应用测试
              获得   4 800  张养殖池塘影像及其对应的掩膜标签。按                   集。本文使用的       GF-2 PMS  影像信息如表      1  所示。


                                         表 1    所使用  GF-2 PMS  影像的采集时间及覆盖区域
                                Tab. 1    The acquisition time and coverage area of the GF-2 PMS imagery
                           用途 Usages                     成像时间 Imaging time            覆盖区域 Coverage zones
                   建模数据集
                   (训练集、验证集和测试集)                   2019-01-25、2019-09-19、2019-10-28、  旧镇湾、东山湾、诏安湾
                   Modeling datasets                2020-10-02、2020-11-20、2018-06-27
                   (training set, validation set, and test set)
                   应用测试集                            2019-10-23、2020-10-02、2020-12-20  诏安湾、宫口湾
                   Application test set

               1.2 Res-PGAUnet 模型                                  针对模型进行深浅层特征融合时,全局上下文
                  本研究在     U-Net 模型基础上,构建一种带有                  信息存在被稀释的情况,通过由多个                1×1  卷积和上
              ResNet、 PPM、 GB    和   scSE  的  Res-PGAUnet 模    采样操作组成的        GB  对  PPM  所捕获的全局上下文
              型。使用     ResNet 替换   U-Net 原有的编码器结构,             信息进行传递。其中,1×1           卷积负责调整特征图的
              进一步提升模型的特征提取能力,减少模型参数量                           通道深度,上采样系数恢复特征图尺寸,目的是与
              和计算量。在编码器后引入              PPM [23]  和  GB,帮助     不同级别的深浅层特征通道数和尺寸保持一致,实
              网络获取丰富的全局上下文信息,提高模型对于不                           现无缝合并。不同级别的深浅层特征和全局上下
              同尺度目标的识别和分割能力。在解码器不同阶段                           文  GB  进行通道相加,使不同级别的特征图都接入
              引入   scSE [24] ,对深、浅层特征与       GB  融合得到的         丰富的全局上下文信息,进而提升特征图的质量。
              养殖池塘提取结果进行优化,进一步提升模型提取                            1.4 双注意力机制
              性能。编码器主要包括核心组件(Special unit) 、                       注意力机制通过聚焦有效特征并抑制无用信
              基础模块(Common)和最大池化层(MaxPool) ,                    息,显著提升模型训练预测的精准度。常见的注意

              解码器主要包括上采样(Upsample) 、scSE              模块       力机制包括空间注意力、通道注意力及混合注意
              和  3×3  卷积单元(3×3 Conv) ,U     型结构外的     PPM      力。空间注意力通过对不同空间位置的特征图进行
              和  GB  模块,负责捕捉和引导全局上下文信息。其                       加权,使网络能够更好地聚焦于对当前任务最为有
              中,编码器的       Special unit 负责改变通道维数,而             用的空间位置;通道注意力(如               SE  注意力 [26] )则
              Common  不改变通道维数,负责特征提取;解码器                       对每个通道进行加权,让网络能够更好地关注对当
              中的   3×3  卷积单元包括两组卷积层、批标准化层                      前任务最具价值的特征通道,并抑制噪声;混合注
              ( Batch  normalization, BN) 、 ReLU  函 数 。 Res-   意力(scSE、CBAM      和  BAM  注意力等    [27-28] )融合
              PGAUnet 模型结构见图       1。                          了空间和通道维度,兼具二者优势。
               1.3 PPM  和  GB                                      针对解码器中多级特征融合时产生的噪声干
                  本研究参考      PoolNet+模型  [25] ,利用  PPM  对输     扰,本研究在每个解码阶段引入               scSE  混合注意力
              入特征图执行       1×1、2×2、3×3    和  6×6  四种不同尺        模块。该模块是基于          SE  注意力模块进行改进,由
              度的池化操作,对包括原始输入在内的多个输出特                           通道注意力(cSE)和空间注意力(sSE)两部分
              征图进行通道拼接,获得具有不同感受野的特征表                           组成。通过对每一级深浅层特征和上下文特征相加
              示,增加对周围区域的空间感知范围,从而提高模                           后的输出特征图进行空间和通道维度的信息整合与
              型对不同尺度养殖池塘的提取能力以及在复杂干扰                           增强,提高模型对图像特征的感知和利用能力,进

              场景下的目标定位能力。PPM             结构如图    2  所示。        一步优化了养殖池塘的提取精度。其结构如图                  3  所示。
   99   100   101   102   103   104   105   106   107   108   109