Page 241 - 《水产学报》2026年第3期
P. 241

3 期                                     水    产    学    报                                 50 卷

              动计数方法      [2-4] 、形态特征识别算法 、附着机理                     尽管上述方法在各自场景中展现了一定的技
                                              [5]
                       [6]
                                     [7]
              分析模型 以及尺寸测量 等多个维度技术。然                            术优越性,但在处理水中鲍这一特定目标的复合
              而,这些技术的应用都建立在对水下鲍目标的快                            型挑战时仍存在明显不足。首先,目前直接针对
              速且精准定位上。因此,构建高效、鲁棒的目标                            海洋牧场水下养殖环境鲍智能检测的研究相对匮
              检测算法成为推动鲍智能化捕捞走向产业化的核                            乏。其次,现有的解决方案难以完全适配鲍的检
              心支撑。                                             测难题:通用的图像增强算法              [28]  虽能缓解色偏与
                   实现鲍的智能识别与定位,必须克服由水下                         模糊,但对鲍与岩石背景的纹理级“伪装”问题效
              复杂环境引发的一系列严峻挑战:①鲍通常栖息                            果有限;而为其他物种设计的网络结构优化,也
              于岩石和海藻等复杂基底,外壳的颜色、纹理与                            并未直接针对性解决鲍检测中“目标与背景低对比
              周围环境高度相似,导致目标与背景的区分度极                            度”这一核心矛盾。近年来,以              YOLOv8-v11  等为
              低。②海水水体对光线存在波长依赖性衰减,尤                            代表的先进模型虽在通用检测上表现卓越,但其
              其对长波长的红光吸收强烈,衰减强度可达蓝绿                            标准架构在直接应用于水中鲍识别时,仍难以有
              光的   8~12  倍,导致水下图像普遍存在严重色偏。                     效克服光学失真与生物伪装的双重干扰,其识别
              例如,在     1 m  水深时,红色通道能量衰减便可超                    准确性仍不满足机器捕捞的实际应用要求 。
                                                                                                   [29]
              过  95% 。③水中的悬浮颗粒物引发的选择性散                             为精准攻克水下环境中鲍识别的难题,本研
                     [8]
              射效应会造成图像模糊,在高浊度                (NTU>15) 水域       究提出了一种新型高效的检测模型——YOLOv11-
              中,该过程可使图像边缘锐度下降                 40%  以上  [9-10] ,  AMSTAR。主要贡献如下:
              进一步增加了有效特征提取的难度。                                     ①针对复杂水下场景中空间信息解析困难的
                   水下目标检测的深度学习模型分为两阶段与                         问题,引入了      ADown  下采样模块。该模块能有效
                                               [11]
              单阶段两大类。两阶段模型如              R-CNN 、Faster R-      保留深层网络中的关键空间特征,提升模型对鲍
                   [12]
              CNN 、Mask R-CNN     [13]  在精度上表现优异,但计            栖息背景的理解与分辨能力。
              算复杂度和延迟使其难以满足实时捕捞的需求。                                ②为解决鲍与岩石背景特征高度相似的伪装
                                                [14]
              相比之下,单阶段模型如               RetinaNet 、SSD  系      问题,创新性地设计了           C3Star 模块。该模块利用
              列  [15] 、 YOLO  系 列  [16-20] 、 EfficientDet 、 DETR [22]  星型拓扑结构增强了高维特征的交互与表达能力,
                                               [21]
              凭借其高效性与实用性的平衡,更适合水下实时                            显著提升了模型区分目标与背景的精确度。
              检测任务。针对水下环境的特殊性,研究者提出                                ③为抑制水下多源噪声干扰,采用了                  ACmix
              了多种优化方案。从数据源或预处理入手,如                             注意力机制。该机制能自适应地融合卷积与自注

              Tian  等  [23]  利用深度卷积神经网络      (DCNN) 分析水        意力的优势,强化有效特征并抑制由光学失真和
              下声波形数据进行分类识别,张铮等                  [24]  则引入白     图像退化引入的噪声,从而增强了模型的鲁棒性。
              平衡与    Gamma 校正的图像增强算法来提升水下中
                                                                1    材料与方法
              华绒螯蟹     (Eriocheir sinensis) 图像质量。还有一些
              学者则聚焦于网络结构的改进:Al 等                  [25]  提出的
                                                                1.1    数据采集
              YOLO-Fish  方案则通过优化上采样和引入空间金
              字塔池化     (SPP) 模块,提升了在模糊、低光照条                        本研究采集了大量水下鲍图像制作实验数据
              件 下 对 鱼 类 的 检 测 性 能 。 刘 侦 龙 等         [26]  提 出  集,共    2 700  张。在数据集的构成中,60%           来自
              YOLOv10-MECAS    模 型 , 引 入 空 间 注 意 力 模 块         广东省湛江市雷州流沙湾海域农业农村部国家级
              (MECAS)、空洞卷积       (SAConv)、边界框回归损失              海洋牧场的水下相机拍摄,40%              源自互联网公开
              函数   (MPDIoU) 和基于暗通道先验的水下图像增                     水下视频。数据集涵盖了不同的光照条件和复杂
              强算法    (UDCP),有效提升了复杂水下环境中海参                     的背景环境      (如岩石、海藻等)。为了提取出有效
              的 检 测 精 度 和 鲁 棒 性 。 Mai       [27]  等 提 出  UM-   的鲍目标图像,对视频数据采用帧抽取技术,通
              YOLOv10,融合残差注意力模块、双向特征金字                         过固定间隔帧采样         (2 s/帧) 结合分层采样帧采样。
              塔和   Focal Loss 损失函数,有效强化模型对复杂                   图版Ⅰ展示了数据集的部分样本。
              水下场景中生物目标的识别能力与可靠性。                                  为进行模型训练和评估,将数据集划分为训

              https://www.china-fishery.cn                           中国水产学会主办    sponsored by China Society of Fisheries
                                                            2
   236   237   238   239   240   241   242   243   244   245   246