Page 212 - 《水产学报》2025年第7期
P. 212

曹正良,等                                                                 水产学报, 2025, 49(7): 079616
                       x−µ c
                                                        (4)
                   ˆ x = √                                     图  [FeatureSize, (H,W)],这里将     (H,W) 整合
                        σ +ϵ
                         2
                                                               为一个维度便于展示。这种模块通过对每个小
              式中,N、H、W 分别代表三个通道,μ 为各个
                                                   c
                                                               批量的数据进行归一化处理,能够有效降低训
              通道的均值,σ 为方差,            ˆ x为输入进行的标准化。            练过程中的梯度波动、稳定模型训练;此外可
                            2
              通过对各通道的均值与方差对输入进行标准化                             以加速模型的收敛、减少训练时间,尤其在复
              即得到,旨在加速训练过程并提高模型的性能                             杂数据分布下表现尤为明显。在处理梅尔频谱
              和稳定性。                                            图时, BN    模块还能够减轻特征值尺度变化对
                   BN  的原理如图      5  所示,其中每一个正方                模型的影响,使模型更易于捕捉关键声音特征,
              框代表一个特征图,三个维度分别代表通道                              提升分类的稳健性和精确度,从而显著改善虾
              (Channel, C)、minibatch (BatchSize, N)、特征         类行为分类的性能表现。


                                                                     X 1            X 2





                                                   C                X n             X 3
                                                                (μ 1n , σ 1n )
                          H, W                                  (μ 12 , σ 12 )
                                                               (μ 11 , σ 11 )


                                     N
                                                图 5    Batch Normalization  模块
                                              Fig. 5 Batch Normalization module

                   为验证    BN  对于卷积神经网络的有效性,                    1.33%。模型迭代      150  次进行消融实验的收敛曲
              本研究将从多个评价指标综合比较改进前后模                             线如图    7  所示。
              型的训练结果,以择优选取最适合的模型。这                                 加入   BN  可以缓解梯度消失和减少过拟合
              些评价指标包括模型的准确率、分类精确率、                             问题,使得模型训练更加稳定,收敛速率更快,
              F1  值以及召回率。                                      曲线更加平滑,可以更容易地训练出高性能的
                   从训练的表现看,对于改进的               BN-ResNet18     模型, 减少对其他正则化的依赖,从而简化模
              (图  6) 的识别准确率相对于            ResNet18  有所提        型的参数调整过程。
              高,即使损失值有所上升,但是准确率提高了                                 将 BN 应用于      VGG16 与   ResNet18  模型结


                                                 1*1
                                              Conv, 256/2

                                                                               自适应平
                                                                               均池化层
                          输入层        3*3     3*3      3*3      3*3      BN      adaptive    输出层
                         input layer  Conv-  ...  Conv-  ...  Conv-  ...  Conv-  512*1  average  ...  output
                         224*224*3   64      128      256      512      *1      pooling      layer
                                                                                 layer       512
                                                                                512*1*1
                                                           1*1
                                                        Conv, 512/2
                                        1*1
                                      Conv, 128/2
                                                   图 6    模型  BN-ResNet18
                                                 Fig. 6 Model BN- ResNet18

              https://www.china-fishery.cn                           中国水产学会主办    sponsored by China Society of Fisheries
                                                            6
   207   208   209   210   211   212   213   214   215   216   217