Page 244 - 《水产学报》2026年第3期
P. 244

3 期                   李坤达,等:基于改进         YOLOv11  的海洋牧场中鲍的检测方法                           50 卷


                                                           CBS
                                                     C//2

                                   AvgPooling                               c
                            input                                                      output
                                                       MaxPooling   CBS
                                                   C//2         C//2

                                                     图 2    ADown  模块
                                                  Fig. 2 Structure of ADown

              3×3  的  CBS  模块进行空间特征提取,同步完成通                    模块,StarNet 利用星型运算,进行一种逐元素乘
              道数调整至目标维度           COUT/2(COUT   为输出特征          法的特征融合机制,可将输入特征映射到隐式高
              图的通道数)。                                          维空间,提升网络的非线性表达能力。在单层神
                   轻量化池化路径:特征子图             X 2 经  1×1  卷积核    经网络中,StarNet 将权重矩阵与偏置项合并为一
              的  Max-Pooling 层处理,在保持特征响应强度的                    个整体,从而简化了表达和计算过程。可以表示
                                                                       
              同时实现零参数量下采样。                                           W
                                                               为  W =      ,其中  W  表示权重部分,B  表示偏置
                                                                        
                                                                        
                                                                        
                   最终,双路径输出的特征张量在通道维度进                                B                       (   ) (    )
                                                                                                T
                                                                                                       T
                                                               项。通过此方法实现星型运算,                  ω x × ω x 。
              行拼接融合,形成输出特征图。这种设计通过分                                                             1      2
                                                               为了简化分析,对单输入单输出的场景重新定义
              解卷积计算和引入下采样操作,在保证特征表达
                                                               ω 和 ω x ∈ R (d+1)×1 ,很容易地扩展到多个输出通
                                                                      ,
              能力的同时显著降低了计算复杂度。                                  1    2
                                                               道。星型运算可以表示为:
                   本研究将骨干网络中的             B2、B4、B6    层和
                                                                         T
                                                                    T
              B8  层的卷积层替换为         ADown  模块。这一设计使                 ω x×ω x
                                                                         2
                                                                    1
                                                                                   
                                                                      d+1
              得网络能够在多层次下采样过程中捕捉到更丰富                                  ∑       d+1    
                                                                             ∑
                                                                     
                                                                        i i     j j 
                                                                             
                                                                   =    ω x  ×   ω x  
                                                                          1  
              的细节特征,并通过采用不同尺寸的卷积核及池                                             2  
                                                                      i=1       j=1
              化方法,进一步增强了特征表达的多样性和精度。                                 d+1 d+1                            (1)
                                                                     ∑∑
                                                                            i  j i j
              通过对两个分支输出的拼接,构建出融合多种感                                =       ω ω x x
                                                                            1
                                                                              2
                                                                     i=1 j=1
              受野特性的综合特征表示。
                                                                           1 1
                                                                                         4 5
                                                                   = α(1.1)x x +···+α(4.5)x x +···+
                    C3Star 模块  在    YOLOv11  中,C3K2   模块
                                                                                 x
                                                                   α(d +1.d +1)x d+1 d+1
              依靠标准卷积操作在复杂场景下展示了卓越的深
              层特征提取能力,但其架构设计存在明显局限性。                           式中,i,j 为索引通道,d        为输入特征的通道数,          α
              主要有:①多层卷积堆叠虽能增强语义理解,但                            为每个项目的系数:
              带来了较高的计算复杂度。②感受野固定导致对                                           ω ω  j    if  i = j,
                                                                                i
                                                                         
                                                                         
                                                                   α(i, j) =   i  j 1  2  j  i         (2)
              小尺度目标几何特征的捕捉能力不足。③在多尺                                        ω ω +ω ω 2   if  i , j.
                                                                               2
                                                                             1
                                                                                   1
              度特征融合中高维非线性特征表达不充分,尤其                                如式   (1) 所示,星型运算可表示为两个线性
              在水下等复杂环境中,难以有效建模跨尺度特征                                                   (d +2)(d +1)
                                                               项的乘积。展开后可得到                       个组合项。
              间的高阶关联。为此,提出了               C3Star 模块  (图  4),                               2
                                                               涵盖所有的一阶与二阶特征交互,并通过                    α(i , j)
              融合了    StarNet 与  C3K2  的优势。旨在弥补        C3K2
                                                               赋予不同权重。每个组合项均与              x存在非线性关系,
              的不足,通过改进特征表达和优化计算效率,使
                                                               表示了其在高维空间中的扩展表示。因此,星型
              模型在保持高效运算的同时,显著提升检测精度,
                                                               运算在不显式构建高维空间的情况下,等效于将
              且在处理小目标及复杂环境下的多尺度特征关联                                           (d +2)(d +1)  (  d  ) 2
              问题时表现更加优异,从而大幅改善了复杂场景                            原始特征映射至            2      ≈ √ 2  维度的隐式
              下目标检测的鲁棒性。                                       空间。该方式在保持计算效率的同时,有效增强
                   StarNet [32]  如图  3  所示是一种增强型特征提取           了特征表达能力,捕捉更复杂的高阶特征交互。
              中国水产学会主办  sponsored by China Society of Fisheries                          https://www.china-fishery.cn
                                                            5
   239   240   241   242   243   244   245   246   247   248   249