Page 245 - 《水产学报》2026年第3期
P. 245
3 期 水 产 学 报 50 卷
FC
DW-Conv * FC DW-Conv
FC
图 3 StarNet 模块结构
Fig. 3 Structure of StarNet
StarNet
...n...
StarNet
StarNet
CBS,S=1,K=1 split C CBS,S=1,K=1
图 4 C3Star 模块结构
Fig. 4 Structure of C3Star
d+1 d+1 ( ) 2 1
∑∑ i j i j √ d 中目标聚焦困难及背景干扰问题,本研究设计了
O 1 = ω ω x x ∈ R 2
(1.1) (1.2)
i=1 j=1 ACmix 注意力机制,如图 5 所示。通过协同整合
( ) 2 2
d 卷积操作的局部感知优势与自注意力机制的全局
T T √
O 2 = w o 1 ×w o 1 ∈ R 2
2,1 2,2 关联特性,构建双路径特征增强架构,有效提升
( ) 2 3 (3)
d
[33]
T T √ 水下鲍目标的特征表征能力 。该模块参数体系
O 3 = w o 2 ×w o 2 ∈ R 2
3,1 3,2
··· 包含特征图尺寸 (H×W)、通道维度 (C) 及注意力
( ) 2 l
d 头数 (N) 等核心要素。
T T √
O l = w o l−1 ×w o l−1 ∈ R 2
l,1 l,2
该模块采用两阶段特征处理结构:在特征预
通过层层堆叠的方式,能够递归地近乎无限
处理阶段,通过并行三通道 1×1 卷积核实现输入
地扩展隐维指数。StarNet 模型以其简洁而强大的 特征线性变换,以此实现特征的线性投影。完成
特性著称,其网络结构小巧且配备了高效的星型
这一步骤后,将输出重新组织成 N 个分离的特征
运算机制,这一设计显著削减了冗余信息及计算
块。由此产生的每个特征块共同构成了一个由
成本。具体来说,本研究采取了一项创新举措,
3×N 个特征映射组成的集合,形成了一个内容丰
即将 StarNet 中的某一阶段与 C3K2 进行融合,如
富且表达力强的中间特征集 E,有效地增强了后
图 4 所示。从而替换为 YOLOv11 主干网络中对 续处理的信息特征基础。
应的阶段。 在第二阶段,处理路径遵循不同的范式。针
在多尺度特征提取的基础上,C3Star 引入了
对自注意力路径,本研究将中间特征集重新划分
星型操作,有效提升了特征表达的非线性能力。 为 N 组,每组包含 3 类源自 1×1 卷积的特征映射。
相比之下,虽然 C3K2 采用逐层细化特征的方法, 分别承担 query、key 和 value 的功能角色,从而
但在处理复杂特征时往往面临信息丢失或过度简 实现多头自注意力结构的构建。而在采用 1×1 卷
化的问题,并且难以充分挖掘不同尺度之间的高 积的路径中,则通过引入轻量化的全连接层以补
阶关联。C3Star 通过星操作实现隐式高维特征映 充生成额外的特征图信息。通过移位和聚合这些
射,既保留了原始特征,又增强了特征间的高阶 生成的特征,对输入特征执行卷积操作,从而从
关联性,从而显著提升了模型的表示能力。此外, 局部感受野中提取信息。具体到鲍水下识别的海
C3Star 融合了卷积和星操作的优势,不仅优化了 底应用场景,这两种路径的设计提升了捕捉鲍图
计算效率,还强化了特征融合效果,使其在复杂 像的空间和上下文信息能力。自注意力机制有助
任务中表现更加卓越。 于强调重要的局部细节,而卷积路径则确保模型
ACmix 注意力模块 针对水下复杂环境 能够有效地处理图像中的空间关系和纹理模式,
https://www.china-fishery.cn 中国水产学会主办 sponsored by China Society of Fisheries
6

