Page 214 - 《水产学报》2025年第7期
P. 214

曹正良,等                                                                 水产学报, 2025, 49(7): 079616


                          BN-ResNet18 召回率 recall of BN-ResNet18  3.2    模型比较
                          BN-ResNet18 F1 值 BN-ResNet18 F1 score
                          BN-ResNet18 精确率 precision of BN-ResNet18
                    1.0                                            为了验证实验中提出的方法,本研究对比
                                                               了相关模型在本数据集上的识别准确率。
                    0.8
                                                                   结果表明,ResNet18      在准确率、内存占用和
                 百分比/%  percentage  0.6                        计算效率方面均显著优于传统             97.67%,较 和  VGG16。
                                                                                           CNN
                                                                       的识别准确率达到
                                                               ResNet18
                                                                                                    VGG16
                    0.4
                                                               (92.50%) 提升  5.17%,同时内存占用降低          78.9%,
                    0.2                                        运行时间缩短        33.7%,充分证明了残差连接机
                                                               制在复杂行为特征建模中的优越性。进一步引入
                      0
                      摄食 (类别 0)   移动 (类别 1)    打斗 (类别 2)       BN  后,BN-ResNet18   的准确率提升至         99.00%,
                     feeding (Class 0) moving (Class 1)  fighting (Class 2)  较原始  ResNet18  提高  1.33%,验证了  BN  层通
                                   行为类别                        过标准化激活值分布           [ 公式  (4)~(6)] 可有效缓解
                                behavior category
                                                               梯度消失问题,同时使损失波动范围缩小,训
                       图 9    BN-Resnet18  分类识别结果
                                                               练稳定性显著增强。在罗氏沼虾分类任务中,
               Fig. 9 Classification recognition result of BN-Resnet18
                                                               BN-ResNet18  表现出显著的性能优势:在              14.0~

                         表 2    BN-ResNet18  识别结果              44.1 kHz 采样率范围内,分类准确率稳定在
                      Tab. 2    BN-ResNet18 running results    99%,同时内存占用最大减少              188.74 Mb,这一
               采样率/kHz 步幅长度 内存占用/Mb 运行时间/s 分类准确率/%             结果验证了      BN  模块结合残差连接在深层网络
                sampling  length of  memory  run  classification
                frequency  stride  usage   time    accuracy    训练中的有效性。相比之下,BN-VGG16                  由于
                  8.00   107     682.74    9.76     97.94      缺乏跳跃连接机制,在深层网络中容易出现梯
                 10.00   134     678.75    8.19     98.67
                                                               度衰减,导致模型在迭代             80  次后出现过拟合现
                 12.00   161     676.20    6.67     87.81
                                                               象。在相同数据集下,本实验模型与其他研究
                 14.00   188     674.14    5.83     99.00
                                                               中的网络模型       (表  3) 在识别分类任务中进行了
                 16.00   214     672.73    5.05     99.00
                                                               分类准确率比较,证明了              BN-ResNet18  在此分
                 22.05   295.00  673.64    3.64     99.00
                                                               类任务中的高准确性。然而研究还存在以下不
                 44.10   590.00  669.15    1.95     99.00
                                                               足,如在养殖区域存在环境变化、多目标噪声
              究中,实验系统性地评估了不同采样率对模型                             干扰以及虾体大小差异,需要进一步改进采样
              性能的影响。结果显示,在                8 kHz 采样率下,
                                                               方法,如采用多区域高灵敏度水听器采集、设
              模型的步幅长度为           107,内存占用达到          682.74
                                                               计虾类行为特征滤波器以增强微弱信号和构建
              Mb,推理时间为        9.76 s,分类准确率为        97.94%。
                                                               动态环境噪声库等方法,从而提高模型识别
              随着采样率提高至          10 kHz,分类准确率提升至
                                                               能力。
              98.67%,同时推理时间显著缩短至               8.19 s。尽管
              在  12 kHz 采样率下内存使用为            676.20 Mb,但
                                                                      表 3    神经网络模型识别准确率比较
              分类准确率显著下降至             87.81%,这可能与音频
              特征的稀疏性有关。在             14  和  16 kHz 时,模型           Tab. 3    Comparison of recognition accuracy of
                                                                            neural network models
              达到   99%  的分类准确率,推理时间进一步减少
              至  5.83  和  5.05 s,显示出更高采样率下的模型                           模型             准确率/%        文献
                                                                       model           accuracy   reference
              表现更优越。随着采样率增加至                 14.0~44.1 kHz,      TAP-SEResNet           90.00       [16]
              分类准确率继续保持            99%,推理时间进一步降                  光流法+RNN                67.50       [5]
              低至   3.64  和  1.95 s。这些结果表明,在一定的                   Optical Flow +RNN
                                                                 Mini-ImageNet+Resnet18  91.00      [17]
              采样率范围内,即在中高采样频率段,BN-Res-
                                                                 3D-CNN                 80.00       [18]
              Net18  模型可以实现最佳的分类性能与推理
              效率。                                                BN-ResNet18            99.00       本文

              https://www.china-fishery.cn                           中国水产学会主办    sponsored by China Society of Fisheries
                                                            8
   209   210   211   212   213   214   215   216   217   218   219