Page 104 - 《渔业研究》2025年第6期
P. 104
第 6 期 陈红梅等: 基于 Res-PGAUnet 的沿海养殖池塘遥感提取研究 795
大,分布有河道和盐田等干扰地物。 7∶2∶1 比例将 4 800 张影像随机划分为训练集、
本研究收集了 6 景范围覆盖旧镇湾、东山湾及 验证集和测试集。在模型训练过程中,对训练集中
诏安湾的 GF-2 PMS 遥感影像,用于制作模型训 的图像进行水平翻转、旋转和椒盐噪声等数据增强
练、验证、测试数据集。对影像进行辐射定标、大 操作。为验证模型在大范围养殖区提取的泛化性
气校正、正射校正、图像融合等预处理后,使用 能,选取 3 景范围包括诏安湾、宫口湾的 GF-2 PMS
ArcGIS 制作标签,按 256×256 像素大小、0% 重叠 高分辨率遥感影像进行辐射定标、大气校正、正射
率进行裁剪,筛除标签占比小于 30% 的数据,总计 校正、图像融合等预处理,制作标签得到应用测试
获得 4 800 张养殖池塘影像及其对应的掩膜标签。按 集。本文使用的 GF-2 PMS 影像信息如表 1 所示。
表 1 所使用 GF-2 PMS 影像的采集时间及覆盖区域
Tab. 1 The acquisition time and coverage area of the GF-2 PMS imagery
用途 Usages 成像时间 Imaging time 覆盖区域 Coverage zones
建模数据集
(训练集、验证集和测试集) 2019-01-25、2019-09-19、2019-10-28、 旧镇湾、东山湾、诏安湾
Modeling datasets 2020-10-02、2020-11-20、2018-06-27
(training set, validation set, and test set)
应用测试集 2019-10-23、2020-10-02、2020-12-20 诏安湾、宫口湾
Application test set
1.2 Res-PGAUnet 模型 针对模型进行深浅层特征融合时,全局上下文
本研究在 U-Net 模型基础上,构建一种带有 信息存在被稀释的情况,通过由多个 1×1 卷积和上
ResNet、 PPM、 GB 和 scSE 的 Res-PGAUnet 模 采样操作组成的 GB 对 PPM 所捕获的全局上下文
型。使用 ResNet 替换 U-Net 原有的编码器结构, 信息进行传递。其中,1×1 卷积负责调整特征图的
进一步提升模型的特征提取能力,减少模型参数量 通道深度,上采样系数恢复特征图尺寸,目的是与
和计算量。在编码器后引入 PPM [23] 和 GB,帮助 不同级别的深浅层特征通道数和尺寸保持一致,实
网络获取丰富的全局上下文信息,提高模型对于不 现无缝合并。不同级别的深浅层特征和全局上下
同尺度目标的识别和分割能力。在解码器不同阶段 文 GB 进行通道相加,使不同级别的特征图都接入
引入 scSE [24] ,对深、浅层特征与 GB 融合得到的 丰富的全局上下文信息,进而提升特征图的质量。
养殖池塘提取结果进行优化,进一步提升模型提取 1.4 双注意力机制
性能。编码器主要包括核心组件(Special unit) 、 注意力机制通过聚焦有效特征并抑制无用信
基础模块(Common)和最大池化层(MaxPool) , 息,显著提升模型训练预测的精准度。常见的注意
解码器主要包括上采样(Upsample) 、scSE 模块 力机制包括空间注意力、通道注意力及混合注意
和 3×3 卷积单元(3×3 Conv) ,U 型结构外的 PPM 力。空间注意力通过对不同空间位置的特征图进行
和 GB 模块,负责捕捉和引导全局上下文信息。其 加权,使网络能够更好地聚焦于对当前任务最为有
中,编码器的 Special unit 负责改变通道维数,而 用的空间位置;通道注意力(如 SE 注意力 [26] )则
Common 不改变通道维数,负责特征提取;解码器 对每个通道进行加权,让网络能够更好地关注对当
中的 3×3 卷积单元包括两组卷积层、批标准化层 前任务最具价值的特征通道,并抑制噪声;混合注
( Batch normalization, BN) 、 ReLU 函 数 。 Res- 意力(scSE、CBAM 和 BAM 注意力等 [27-28] )融合
PGAUnet 模型结构见图 1。 了空间和通道维度,兼具二者优势。
1.3 PPM 和 GB 针对解码器中多级特征融合时产生的噪声干
本研究参考 PoolNet+模型 [25] ,利用 PPM 对输 扰,本研究在每个解码阶段引入 scSE 混合注意力
入特征图执行 1×1、2×2、3×3 和 6×6 四种不同尺 模块。该模块是基于 SE 注意力模块进行改进,由
度的池化操作,对包括原始输入在内的多个输出特 通道注意力(cSE)和空间注意力(sSE)两部分
征图进行通道拼接,获得具有不同感受野的特征表 组成。通过对每一级深浅层特征和上下文特征相加
示,增加对周围区域的空间感知范围,从而提高模 后的输出特征图进行空间和通道维度的信息整合与
型对不同尺度养殖池塘的提取能力以及在复杂干扰 增强,提高模型对图像特征的感知和利用能力,进
场景下的目标定位能力。PPM 结构如图 2 所示。 一步优化了养殖池塘的提取精度。其结构如图 3 所示。

