Page 210 - 《水产学报》2025年第7期
P. 210
曹正良,等 水产学报, 2025, 49(7): 079616
2 数据集的构建 式中,f 为普通频率,M(f) 为频率 f 对应的梅尔
频率。
因为梅尔频率轴可以使高频成分分辨率降
摄食、打斗、移动三种行为的波形图转换
低,从而可以在保留虾类声音信号关键特点的
为 Mel 频谱图如图 4 所示。将采集的音频数
同时降低数据的维度,并且 Mel 频谱图在环境
据随机截断成 3 s/个,可以观察到罗氏沼虾摄
噪声中有一定的稳健性,便于减少特征空间的
大小,有利于模型的训练,经过转换声音的能 食发声信号的频谱结构较为简单,只有一个明
量值被压缩到了更小的范围。在声音转换过程 显的纵向频率带,并且高频区域能量较低,高
中,将音频信号转换为 Mel 频谱图时,首先需 能量区域集中在纵向条带,能量的分布较集中
要将频率转换为 Mel 刻度,然后将 Mel 刻度分 (图 4-a)。罗氏沼虾打斗的频谱图中,有特定频
[23]
成一组滤波器,得到梅尔滤波器组,计算公式 : 率的能量集中在一些短时间区间内,显示出一
( )
f 些突发的频率分量,且幅值较大 (颜色较亮),
M( f) = 2 595lg 1+ (1)
700 而罗氏沼虾在缸底移动爬行的能量分布更均匀,
0
1.0 8 192
10
振幅/dB amplitude 0.8 频率/Hz frequency 2 048 能量/dB energy
0.6
1 024
0.4
0.2 512 70
0
0 0.5 1.0 1.5 2.0 2.5 3.0 0 1.5 3.0
时间/s 时间/s
time
time
(a)
0
1.0 8 192
0.9 10
0.8
振幅/dB amplitude 0.7 频率/Hz frequency 2 048 能量/dB energy
0.6
0.5
1 024
0.4
0.3 512 70
0.2 0
0 0.5 1.0 1.5 2.0 2.5 3.0 0 1.5 3.0
时间/s 时间/s
time
time
(b)
0
8 192
0.4 10
0.3
振幅/dB amplitude 0.2 频率/Hz frequency 2 048 能量/dB energy
0.1
1 024
−0.1 0 512 70
−0.2 0
0 0.5 1.0 1.5 2.0 2.5 3.0 0 1.5 3.0
时间/s
时间/s
time time
(c)
图 4 分别代表摄食 (a)、打斗 (b)、移动 (c) 的波形图及其 Mel 图
Fig. 4 The waveform plots and corresponding Mel spectrums representing (a) feeding,
(b) fighting, and (c) moving
https://www.china-fishery.cn 中国水产学会主办 sponsored by China Society of Fisheries
4