Page 245 - 《水产学报》2026年第3期
P. 245

3 期                                     水    产    学    报                                 50 卷


                                                      FC
                                          DW-Conv            *    FC     DW-Conv
                                                      FC




                                                   图 3    StarNet 模块结构

                                                  Fig. 3 Structure of StarNet

                                                        StarNet
                                                         ...n...
                                                        StarNet
                                                         StarNet
                                    CBS,S=1,K=1   split             C    CBS,S=1,K=1

                                                   图 4    C3Star 模块结构
                                                  Fig. 4 Structure of C3Star
                        d+1 d+1               (  ) 2 1
                        ∑∑     i   j   i j     √ d             中目标聚焦困难及背景干扰问题,本研究设计了
                   O 1 =      ω   ω   x x  ∈ R  2
                               (1.1)  (1.2)
                        i=1 j=1                                ACmix  注意力机制,如图        5  所示。通过协同整合
                                              (  ) 2 2
                                               d               卷积操作的局部感知优势与自注意力机制的全局
                         T      T              √
                   O 2 = w o 1 ×w o 1      ∈ R  2
                         2,1    2,2                            关联特性,构建双路径特征增强架构,有效提升
                                              (  ) 2 3  (3)
                                               d
                                                                                        [33]
                         T      T              √               水下鲍目标的特征表征能力 。该模块参数体系
                   O 3 = w o 2 ×w o 2      ∈ R  2
                         3,1    3,2
                   ···                                         包含特征图尺寸        (H×W)、通道维度       (C) 及注意力
                                              (  ) 2 l
                                               d               头数  (N) 等核心要素。
                         T       T             √
                   O l = w o l−1 ×w o l−1  ∈ R  2
                         l,1     l,2
                                                                   该模块采用两阶段特征处理结构:在特征预
                   通过层层堆叠的方式,能够递归地近乎无限
                                                               处理阶段,通过并行三通道             1×1  卷积核实现输入
              地扩展隐维指数。StarNet 模型以其简洁而强大的                       特征线性变换,以此实现特征的线性投影。完成
              特性著称,其网络结构小巧且配备了高效的星型
                                                               这一步骤后,将输出重新组织成               N  个分离的特征
              运算机制,这一设计显著削减了冗余信息及计算
                                                               块。由此产生的每个特征块共同构成了一个由
              成本。具体来说,本研究采取了一项创新举措,
                                                               3×N  个特征映射组成的集合,形成了一个内容丰
              即将   StarNet 中的某一阶段与       C3K2  进行融合,如
                                                               富且表达力强的中间特征集              E,有效地增强了后
              图  4  所示。从而替换为        YOLOv11  主干网络中对            续处理的信息特征基础。
              应的阶段。                                                在第二阶段,处理路径遵循不同的范式。针
                   在多尺度特征提取的基础上,C3Star 引入了
                                                               对自注意力路径,本研究将中间特征集重新划分
              星型操作,有效提升了特征表达的非线性能力。                            为  N  组,每组包含     3  类源自  1×1  卷积的特征映射。
              相比之下,虽然        C3K2  采用逐层细化特征的方法,                分别承担     query、key  和  value 的功能角色,从而
              但在处理复杂特征时往往面临信息丢失或过度简                            实现多头自注意力结构的构建。而在采用                    1×1  卷
              化的问题,并且难以充分挖掘不同尺度之间的高                            积的路径中,则通过引入轻量化的全连接层以补
              阶关联。C3Star 通过星操作实现隐式高维特征映                        充生成额外的特征图信息。通过移位和聚合这些
              射,既保留了原始特征,又增强了特征间的高阶                            生成的特征,对输入特征执行卷积操作,从而从
              关联性,从而显著提升了模型的表示能力。此外,                           局部感受野中提取信息。具体到鲍水下识别的海
              C3Star 融合了卷积和星操作的优势,不仅优化了                        底应用场景,这两种路径的设计提升了捕捉鲍图
              计算效率,还强化了特征融合效果,使其在复杂                            像的空间和上下文信息能力。自注意力机制有助
              任务中表现更加卓越。                                       于强调重要的局部细节,而卷积路径则确保模型
                    ACmix  注意力模块  针对水下复杂环境                     能够有效地处理图像中的空间关系和纹理模式,

              https://www.china-fishery.cn                           中国水产学会主办    sponsored by China Society of Fisheries
                                                            6
   240   241   242   243   244   245   246   247   248   249   250