Page 210 - 《水产学报》2025年第7期
P. 210

曹正良,等                                                                 水产学报, 2025, 49(7): 079616

              2    数据集的构建                                      式中,f 为普通频率,M(f) 为频率             f 对应的梅尔
                                                               频率。
                   因为梅尔频率轴可以使高频成分分辨率降
                                                                   摄食、打斗、移动三种行为的波形图转换
              低,从而可以在保留虾类声音信号关键特点的
                                                               为  Mel 频谱图如图       4  所示。将采集的音频数
              同时降低数据的维度,并且               Mel 频谱图在环境
                                                               据随机截断成        3 s/个,可以观察到罗氏沼虾摄
              噪声中有一定的稳健性,便于减少特征空间的
              大小,有利于模型的训练,经过转换声音的能                             食发声信号的频谱结构较为简单,只有一个明
              量值被压缩到了更小的范围。在声音转换过程                             显的纵向频率带,并且高频区域能量较低,高
              中,将音频信号转换为             Mel 频谱图时,首先需              能量区域集中在纵向条带,能量的分布较集中
              要将频率转换为         Mel 刻度,然后将        Mel 刻度分        (图  4-a)。罗氏沼虾打斗的频谱图中,有特定频
                                                       [23]
              成一组滤波器,得到梅尔滤波器组,计算公式 :                           率的能量集中在一些短时间区间内,显示出一
                               (      )
                                    f                          些突发的频率分量,且幅值较大                  (颜色较亮),
                   M( f) = 2 595lg 1+                   (1)
                                   700                         而罗氏沼虾在缸底移动爬行的能量分布更均匀,

                                                                                                0
                        1.0                                             8 192
                                                                                                10
                    振幅/dB  amplitude 0.8                            频率/Hz  frequency  2 048         能量/dB  energy
                        0.6
                                                                        1 024
                        0.4
                        0.2                                              512                    70
                                                                           0
                            0    0.5  1.0   1.5  2.0   2.5   3.0            0       1.5      3.0
                                           时间/s                                    时间/s
                                                                                   time
                                           time
                                                              (a)


                                                                                                0
                        1.0                                             8 192
                        0.9                                                                     10
                        0.8
                    振幅/dB  amplitude  0.7                           频率/Hz  frequency  2 048         能量/dB  energy
                        0.6
                        0.5
                                                                        1 024
                        0.4
                        0.3                                              512                    70
                        0.2                                                0
                            0    0.5  1.0   1.5  2.0   2.5   3.0            0       1.5      3.0
                                           时间/s                                    时间/s
                                                                                   time
                                           time
                                                              (b)

                                                                                                0
                                                                        8 192
                        0.4                                                                     10
                        0.3
                    振幅/dB  amplitude  0.2                           频率/Hz  frequency  2 048         能量/dB  energy
                        0.1
                                                                        1 024
                       −0.1 0                                            512                    70
                       −0.2                                                0
                            0    0.5  1.0   1.5  2.0   2.5   3.0            0       1.5      3.0
                                                                                   时间/s
                                           时间/s
                                           time                                    time
                                                              (c)
                                   图 4    分别代表摄食   (a)、打斗  (b)、移动  (c) 的波形图及其    Mel 图
                           Fig. 4 The waveform plots and corresponding Mel spectrums representing (a) feeding,
                                                  (b) fighting, and (c) moving

              https://www.china-fishery.cn                           中国水产学会主办    sponsored by China Society of Fisheries
                                                            4
   205   206   207   208   209   210   211   212   213   214   215