Page 244 - 《水产学报》2026年第3期
P. 244
3 期 李坤达,等:基于改进 YOLOv11 的海洋牧场中鲍的检测方法 50 卷
CBS
C//2
AvgPooling c
input output
MaxPooling CBS
C//2 C//2
图 2 ADown 模块
Fig. 2 Structure of ADown
3×3 的 CBS 模块进行空间特征提取,同步完成通 模块,StarNet 利用星型运算,进行一种逐元素乘
道数调整至目标维度 COUT/2(COUT 为输出特征 法的特征融合机制,可将输入特征映射到隐式高
图的通道数)。 维空间,提升网络的非线性表达能力。在单层神
轻量化池化路径:特征子图 X 2 经 1×1 卷积核 经网络中,StarNet 将权重矩阵与偏置项合并为一
的 Max-Pooling 层处理,在保持特征响应强度的 个整体,从而简化了表达和计算过程。可以表示
同时实现零参数量下采样。 W
为 W = ,其中 W 表示权重部分,B 表示偏置
最终,双路径输出的特征张量在通道维度进 B ( ) ( )
T
T
项。通过此方法实现星型运算, ω x × ω x 。
行拼接融合,形成输出特征图。这种设计通过分 1 2
为了简化分析,对单输入单输出的场景重新定义
解卷积计算和引入下采样操作,在保证特征表达
ω 和 ω x ∈ R (d+1)×1 ,很容易地扩展到多个输出通
,
能力的同时显著降低了计算复杂度。 1 2
道。星型运算可以表示为:
本研究将骨干网络中的 B2、B4、B6 层和
T
T
B8 层的卷积层替换为 ADown 模块。这一设计使 ω x×ω x
2
1
d+1
得网络能够在多层次下采样过程中捕捉到更丰富 ∑ d+1
∑
i i j j
= ω x × ω x
1
的细节特征,并通过采用不同尺寸的卷积核及池 2
i=1 j=1
化方法,进一步增强了特征表达的多样性和精度。 d+1 d+1 (1)
∑∑
i j i j
通过对两个分支输出的拼接,构建出融合多种感 = ω ω x x
1
2
i=1 j=1
受野特性的综合特征表示。
1 1
4 5
= α(1.1)x x +···+α(4.5)x x +···+
C3Star 模块 在 YOLOv11 中,C3K2 模块
x
α(d +1.d +1)x d+1 d+1
依靠标准卷积操作在复杂场景下展示了卓越的深
层特征提取能力,但其架构设计存在明显局限性。 式中,i,j 为索引通道,d 为输入特征的通道数, α
主要有:①多层卷积堆叠虽能增强语义理解,但 为每个项目的系数:
带来了较高的计算复杂度。②感受野固定导致对 ω ω j if i = j,
i
α(i, j) = i j 1 2 j i (2)
小尺度目标几何特征的捕捉能力不足。③在多尺 ω ω +ω ω 2 if i , j.
2
1
1
度特征融合中高维非线性特征表达不充分,尤其 如式 (1) 所示,星型运算可表示为两个线性
在水下等复杂环境中,难以有效建模跨尺度特征 (d +2)(d +1)
项的乘积。展开后可得到 个组合项。
间的高阶关联。为此,提出了 C3Star 模块 (图 4), 2
涵盖所有的一阶与二阶特征交互,并通过 α(i , j)
融合了 StarNet 与 C3K2 的优势。旨在弥补 C3K2
赋予不同权重。每个组合项均与 x存在非线性关系,
的不足,通过改进特征表达和优化计算效率,使
表示了其在高维空间中的扩展表示。因此,星型
模型在保持高效运算的同时,显著提升检测精度,
运算在不显式构建高维空间的情况下,等效于将
且在处理小目标及复杂环境下的多尺度特征关联 (d +2)(d +1) ( d ) 2
问题时表现更加优异,从而大幅改善了复杂场景 原始特征映射至 2 ≈ √ 2 维度的隐式
下目标检测的鲁棒性。 空间。该方式在保持计算效率的同时,有效增强
StarNet [32] 如图 3 所示是一种增强型特征提取 了特征表达能力,捕捉更复杂的高阶特征交互。
中国水产学会主办 sponsored by China Society of Fisheries https://www.china-fishery.cn
5

