Page 212 - 《水产学报》2025年第7期
P. 212
曹正良,等 水产学报, 2025, 49(7): 079616
x−µ c
(4)
ˆ x = √ 图 [FeatureSize, (H,W)],这里将 (H,W) 整合
σ +ϵ
2
为一个维度便于展示。这种模块通过对每个小
式中,N、H、W 分别代表三个通道,μ 为各个
c
批量的数据进行归一化处理,能够有效降低训
通道的均值,σ 为方差, ˆ x为输入进行的标准化。 练过程中的梯度波动、稳定模型训练;此外可
2
通过对各通道的均值与方差对输入进行标准化 以加速模型的收敛、减少训练时间,尤其在复
即得到,旨在加速训练过程并提高模型的性能 杂数据分布下表现尤为明显。在处理梅尔频谱
和稳定性。 图时, BN 模块还能够减轻特征值尺度变化对
BN 的原理如图 5 所示,其中每一个正方 模型的影响,使模型更易于捕捉关键声音特征,
框代表一个特征图,三个维度分别代表通道 提升分类的稳健性和精确度,从而显著改善虾
(Channel, C)、minibatch (BatchSize, N)、特征 类行为分类的性能表现。
X 1 X 2
C X n X 3
(μ 1n , σ 1n )
H, W (μ 12 , σ 12 )
(μ 11 , σ 11 )
N
图 5 Batch Normalization 模块
Fig. 5 Batch Normalization module
为验证 BN 对于卷积神经网络的有效性, 1.33%。模型迭代 150 次进行消融实验的收敛曲
本研究将从多个评价指标综合比较改进前后模 线如图 7 所示。
型的训练结果,以择优选取最适合的模型。这 加入 BN 可以缓解梯度消失和减少过拟合
些评价指标包括模型的准确率、分类精确率、 问题,使得模型训练更加稳定,收敛速率更快,
F1 值以及召回率。 曲线更加平滑,可以更容易地训练出高性能的
从训练的表现看,对于改进的 BN-ResNet18 模型, 减少对其他正则化的依赖,从而简化模
(图 6) 的识别准确率相对于 ResNet18 有所提 型的参数调整过程。
高,即使损失值有所上升,但是准确率提高了 将 BN 应用于 VGG16 与 ResNet18 模型结
1*1
Conv, 256/2
自适应平
均池化层
输入层 3*3 3*3 3*3 3*3 BN adaptive 输出层
input layer Conv- ... Conv- ... Conv- ... Conv- 512*1 average ... output
224*224*3 64 128 256 512 *1 pooling layer
layer 512
512*1*1
1*1
Conv, 512/2
1*1
Conv, 128/2
图 6 模型 BN-ResNet18
Fig. 6 Model BN- ResNet18
https://www.china-fishery.cn 中国水产学会主办 sponsored by China Society of Fisheries
6