Page 246 - 《水产学报》2026年第3期
P. 246
3 期 李坤达,等:基于改进 YOLOv11 的海洋牧场中鲍的检测方法 50 卷
O (C)
H×W×C
fully connected 3Nhead×k 2 Nconv . . .
O(C )3×N feature maps shift operation concatenation
2
conv 1×1
×N
conv 1×1
+
H×W×C H×W×C
conv 1×1 query O (C)
self-attention concatenation
key
value
H×W×C
×N
图 5 ACmix 模块
Fig. 5 Structure of ACmix
二者结合提供了更加鲁棒的特征表示,以提高鲍 2.2 消融实验
识别的准确性。
在 YOLOv11 基 础 模 型 上 , 本 研 究 集 成 了
2 结果 ACmix 模块、C3Star 模块和 ADown 模块以增强
特征提取效果,通过消融实验评估各模块对整体
2.1 评价指标 性能的影响,具体结果见表 1。
表 1 可知,基线模型 YOLOv11 的 mAP@0.5、
本研究评价指标采用精确率 (P),召回率 (R),
P、 R、 mAP@0.5:0.95 分 别 为 92.37%、 97.16%、
平均精度均值 (mAP)、帧率 (FPS), 计算公式如
87.56%、72.22%。在基线模型中单独集成 ADown
式 (4) 所示:
模 块 后 (YOLOv11-AD), 模 型 的 mAP@0.5 提 升
T P 至 显著提升了 个百分点,达到
P = 94.45%,R 2.92
T P + F P
90.48%。这表明 ADown 轻量化的下采样设计有效
T P 增强了网络对空间特征的捕捉能力,改善了漏检
R =
T P + F N (4) 情况。单独集成 ACmix 模块 (YOLOv11-AC) 后,
n ∑w
1 模型的 P 大幅提升至 99.76%,为所有组合中最高。
P(R)dr
0 这证明 的混合注意力机制能有效抑制复杂
i=0 ACmix
mAP =
N 背景噪声,显著降低误检率,这对于要求高精度
式中, T P 表示模型正确识别并判断为鲍的样本数 的 识 别 任 务 至 关 重 要 。 单 独 集 成 C3Star 模 块
量; F P 指被模型误判为鲍目标,实际上却不是鲍 (YOLOv11-S) 后,各项指标均有小幅提升,其中
的样本数量; F N 表示模型未能识别出实际为鲍的 mAP@0.5:0.95 提升了 0.26 个百分点,说明该模块
目标样本数;dr 表示对召回率 (Recall) 轴进行积 的多尺度特征融合能力有助于提升目标的定位精
分,即计算 P-R (精度-召回率) 曲线下的面积;N 度。最终,集成了所有优化模块的 YOLOv11-
表示参与评估的类别数量。精确率 P 定义为:被 AMSTAR 模型展现出最强的综合性能。与基线模
预测为鲍的样本中,真正是鲍的比例;召回率 R 型 YOLOv11 相比,其各项关键指标均获得显著
是在所有真实为鲍的目标中,模型成功检测出的 提 升 : mAP@0.5 提 升 了 5.21 个 百 分 点 , 达 到
比例。平均精度均值 mAP 是对多个类别精度-召 97.58%;P 提升了 2.66 个百分点,达到 99.82%;
回曲线下的面积进行平均计算所得的结果。在本 R 提 升 了 2.06 个 百 分 点 , 达 到 89.62%; mAP@
例中,评估对象仅有一个类别 (即鲍),因此 N =1。 0.5:0.95 也提升了 1.79 个百分点。
中国水产学会主办 sponsored by China Society of Fisheries https://www.china-fishery.cn
7

