Page 104 - 《渔业研究》2025年第6期

P. 104

第 6 期陈红梅等：基于 Res-PGAUnet 的沿海养殖池塘遥感提取研究 795

大，分布有河道和盐田等干扰地物。 7∶2∶1 比例将 4 800 张影像随机划分为训练集、
本研究收集了 6 景范围覆盖旧镇湾、东山湾及验证集和测试集。在模型训练过程中，对训练集中
诏安湾的 GF-2 PMS 遥感影像，用于制作模型训的图像进行水平翻转、旋转和椒盐噪声等数据增强
练、验证、测试数据集。对影像进行辐射定标、大操作。为验证模型在大范围养殖区提取的泛化性
气校正、正射校正、图像融合等预处理后，使用能，选取 3 景范围包括诏安湾、宫口湾的 GF-2 PMS
ArcGIS 制作标签，按 256×256 像素大小、0% 重叠高分辨率遥感影像进行辐射定标、大气校正、正射
率进行裁剪，筛除标签占比小于 30% 的数据，总计校正、图像融合等预处理，制作标签得到应用测试
获得 4 800 张养殖池塘影像及其对应的掩膜标签。按集。本文使用的 GF-2 PMS 影像信息如表 1 所示。

表 1 所使用 GF-2 PMS 影像的采集时间及覆盖区域
Tab. 1 The acquisition time and coverage area of the GF-2 PMS imagery
用途 Usages 成像时间 Imaging time 覆盖区域 Coverage zones
建模数据集
（训练集、验证集和测试集） 2019-01-25、2019-09-19、2019-10-28、旧镇湾、东山湾、诏安湾
Modeling datasets 2020-10-02、2020-11-20、2018-06-27
(training set, validation set, and test set)
应用测试集 2019-10-23、2020-10-02、2020-12-20 诏安湾、宫口湾
Application test set

1.2 Res-PGAUnet 模型针对模型进行深浅层特征融合时，全局上下文
本研究在 U-Net 模型基础上，构建一种带有信息存在被稀释的情况，通过由多个 1×1 卷积和上
ResNet、 PPM、 GB 和 scSE 的 Res-PGAUnet 模采样操作组成的 GB 对 PPM 所捕获的全局上下文
型。使用 ResNet 替换 U-Net 原有的编码器结构，信息进行传递。其中，1×1 卷积负责调整特征图的
进一步提升模型的特征提取能力，减少模型参数量通道深度，上采样系数恢复特征图尺寸，目的是与
和计算量。在编码器后引入 PPM [23] 和 GB，帮助不同级别的深浅层特征通道数和尺寸保持一致，实
网络获取丰富的全局上下文信息，提高模型对于不现无缝合并。不同级别的深浅层特征和全局上下
同尺度目标的识别和分割能力。在解码器不同阶段文 GB 进行通道相加，使不同级别的特征图都接入
引入 scSE [24] ，对深、浅层特征与 GB 融合得到的丰富的全局上下文信息，进而提升特征图的质量。
养殖池塘提取结果进行优化，进一步提升模型提取 1.4 双注意力机制
性能。编码器主要包括核心组件（Special unit）、注意力机制通过聚焦有效特征并抑制无用信
基础模块（Common）和最大池化层（MaxPool），息，显著提升模型训练预测的精准度。常见的注意

解码器主要包括上采样（Upsample）、scSE 模块力机制包括空间注意力、通道注意力及混合注意
和 3×3 卷积单元（3×3 Conv），U 型结构外的 PPM 力。空间注意力通过对不同空间位置的特征图进行
和 GB 模块，负责捕捉和引导全局上下文信息。其加权，使网络能够更好地聚焦于对当前任务最为有
中，编码器的 Special unit 负责改变通道维数，而用的空间位置；通道注意力（如 SE 注意力 [26] ）则
Common 不改变通道维数，负责特征提取；解码器对每个通道进行加权，让网络能够更好地关注对当
中的 3×3 卷积单元包括两组卷积层、批标准化层前任务最具价值的特征通道，并抑制噪声；混合注
（ Batch normalization， BN）、 ReLU 函数。 Res- 意力（scSE、CBAM 和 BAM 注意力等 [27-28] ）融合
PGAUnet 模型结构见图 1。了空间和通道维度，兼具二者优势。
1.3 PPM 和 GB 针对解码器中多级特征融合时产生的噪声干
本研究参考 PoolNet+模型 [25] ，利用 PPM 对输扰，本研究在每个解码阶段引入 scSE 混合注意力
入特征图执行 1×1、2×2、3×3 和 6×6 四种不同尺模块。该模块是基于 SE 注意力模块进行改进，由
度的池化操作，对包括原始输入在内的多个输出特通道注意力（cSE）和空间注意力（sSE）两部分
征图进行通道拼接，获得具有不同感受野的特征表组成。通过对每一级深浅层特征和上下文特征相加
示，增加对周围区域的空间感知范围，从而提高模后的输出特征图进行空间和通道维度的信息整合与
型对不同尺度养殖池塘的提取能力以及在复杂干扰增强，提高模型对图像特征的感知和利用能力，进

场景下的目标定位能力。PPM 结构如图 2 所示。一步优化了养殖池塘的提取精度。其结构如图 3 所示。

99 100 101 102 103 104 105 106 107 108 109