Page 209 - 《水产学报》2025年第7期
P. 209

曹正良,等                                                                 水产学报, 2025, 49(7): 079616


                                                  相机           15dB) 和  HTI-96-Min  水听器  (High Tech, 美国)。
                                                 camera
                                                                   每天   9:00—10:00  和  18:00—19:00  投喂颗
                                    杆
                                   pole                        粒饲料,喂养       1  个月后开始实验。为了更自然
                                                               地观测罗氏沼虾的行为,水听器设置在水面下
                                      水听器                      15 cm,水下相机紧贴实验水缸的一侧,水上相
                水下相机
                                      hydrophone
                underwater based camera                        机设置在水面以上          60 cm,尽量减少人为干扰
                                                               对罗氏沼虾行为的影响。在数据采集后通过观

                                                               察录像及对声音信号数据               (格式   WAV) 比对,
                           图 1    实验声音采集布设
                                                               确定比较明显的三种特征行为声音信号:摄食、
               Fig. 1 Arrangement of experimental sound acquisition  移动、打斗。


                                                               1.2    基本流程
                                                                   首先通过对采集到的三种特征行为声音信
                                                               号进行    Mel 转换得到     Mel 频谱图,所得        Mel 频
                                                               谱图作为数据集。为了提高模型的泛化能力,
                     (a)          (b)           (c)
                                                               对数据集进行处理         (如将   Mel 频谱图添加高斯噪
                     图 2    SM4 (a)、HTI-96-Min  水听器  (b)
                            与采集相机    Gopro (c)                 声,水平翻转等)。将处理后的数据导入到设计
                                                               的模型中,对训练之后的模型进行测试及性能
                 Fig. 2 SM4 (a), HTI-96-Min hydrophone (b) and
                         acquisition camera Gopro (c)          评估,最终得到模型的性能指标                (运行时间、内
                                                               存占用、分类准确率等)。流程如图                 3  所示。



                                                                                          数据混合
                                                样本声音         转化 Mel 图
                       罗氏沼虾                                                               data mixup
                                                sample sound  Mel graph
                       M. rosenbergii
                                                             transformation



                                                           (a)
                                                                                       BN 实例归一化
                          样本集                     CNN                                  BN instance
                          sample set                                                   normalization
                                      模型训练                改进
                                      model training    improvement
                                                VGG16

                                                                        特征提取层
                                               Resnet18
                                                                        feature extraction layer
                                                           (b)
                                                        识别准确率                        运行时间
                                                        recognition accuracy         run time
                                    性能评估                              确定模型
                                    performance evaluation            certainty model
                         改进的模型                          损失率                          内存占用
                         BN-model                       rate of loss                 memory usage
                                                        召回率                          分类准确率
                                                        recall rate                  classification accuracy
                                                           (c)
                                                     图 3    基本流程图
              (a) 数据处理图,(b) 模型训练与改进图,(c) 评估过程图。
                                                  Fig. 3 Basic flow diagram
              (a) data processing, (b) model training and improvement, (c) evaluation process.

              中国水产学会主办  sponsored by China Society of Fisheries                          https://www.china-fishery.cn
                                                            3
   204   205   206   207   208   209   210   211   212   213   214