Page 21 - 《水产学报》2025年第11期
P. 21

朱国平,等                                                                水产学报, 2025, 49(11): 119102

              图片较为复杂,且易发生鱼体与鱼体、鱼体与                             结 构 即   AlexNet、 VGGNet 与   ResNet 相 结 合 ,
              环境的重叠、遮盖等现象。因此,基于先验知                             深度学习网络用于提取图片特征,SVM                   分类器
              识的传统特征提取无法较好的应对这一类复杂                             用于物种分类,最终达到了               94.3%  的正确率。
              问题,而深度神经网络具有的自动特征提取功                             这表明,深度学习与传统机器学习并不是对立
              能,能够保证在数据量充足的情况下,自动学                             的关系,将二者结合起来使用也许能获得更好
              习图片信息,实现特征提取并进行物种识别。                             的分类效果。其原因在于,传统的机器学习方
                          [64]
                   Boom  等 基于    Fish Recognition Ground-Truth  法的分类方式难以处理高分辨率、低语义的特
              data 数据集,应用       6  种非深度学习方法:朴素                 征,而卷积神经网络可在多层之后输出低分辨
                                   [65]
              高 斯   (Naive Gaussian) 、 随 机 森 林 、 MLP 、         率、高语义的特征,使之更好地用于                  SVM  方法
                                                       [66]
              KNN、逻辑斯特回归           [67]  和  SVM  以及  5  种深度    的分类。同样地,还有             Marti-Puig  等  [72] 在相似
              神经网络结构:CNN、VGG16、VGG19、Res-                      的  9  种鲂鮄科    (Triglidae) 物种识别研究中提出
              Net 和  Inception V3  实现  23  种鱼类物种的识别,           了一种基于鱼类头部轮廓的自动物种识别方法,
              且比较了非深度学习方法分类器及深度神经网                             其应用    Faster-RCNN  由鱼类图片中提取鱼类头
              络结构分类器的效果;结果表明,深度神经网                             部,再利用离散余弦变换             (DCT, Discrete Cosine
              络的分类准确性及模型稳定性均远超传统机器                             Transform) 以及离散傅里叶变换           (DFT, Discrete
              学习分类器 。                                          Fourier Transform) 提取鱼类头部的轮廓信息,
                         [1]
                   基于   CNN  的深度学习网络结构已广泛应                     最终运用极限学习机——ELM             [73]  进行物种识别,
                                                               并达到了     89.4%  的平均正确率。综上,在选择
              用于鱼类物种识别中,Khalifa 等            [68]  在对水族馆
              鱼类的物种识别研究中,分别应用了                     AlexNet     分类器时,研究者尤其需要考虑分类器处理缺
                                                               失数据、噪声数据、过拟合等的能力,以及分
              和  VggNet 网络结构,8       种鱼类物种识别中分别
              取得了    85.59%  和  85.41%  的准确率。                  类器所需要设定的初始参数数量                (表  2)。
                                                                   至于深度神经网络在鱼类种群判别中的应
                   由于现实中水下鱼类的运动具随机性,采
                                                               用,基于现阶段的研究可以发现,该方向的研
              集到的鱼类图片多数情况下会出现不同鱼类相
              互重叠的情况,以及图片上可能会包含有非鱼                             究较为稀缺。其中,Myrum             等  [78]  应用  CNN  分
                                                               类器以    99.16%  的正确率区分了野生和放养利文
              类目标,从而导致鱼类物种识别正确率降低。
                                                               鳟  (Salmo trutta) 种群。因此,深度神经网络在
              为了较好地解决这一类问题,研究者采用先目
                                                               鱼类种群判别中有着巨大的潜力。
              标检测、再分类的方法。例如,Tseng                   等 [69]  将
              Mask R-CNN 神经网络结构应用于金枪鱼、旗                         2.4    评价方法
              鱼、鲨鱼以及其他鱼类的物种识别,取得了                                  模型的性能是否优异需要通过评价指标予
              93.51%  的平均正确率。French         等  [70]  将  Mask R-  以表现。现有的模型评价方法通常基于二分类
              CNN network  应用于    9  种商业鱼类的识别上,                提出。而应用到多分类问题上,需要将多分类
              取得了    62.55%  正确率。后者研究中,由于较大                    问题转化为若干二分类问题,验证模型的性能 。
                                                                                                        [79]
              一部分图片数据中的鱼体不完整,因而物种识                                 在二分类问题中,某样本可能存在以下几
              别难度较大,最终正确率低于                 Tseng  等 [69]  的结  种情况:
              果。此外,具有同样功能的深度卷积神经网络                                 ①若一个实例是正类,并且被预测为正类,
              Inception V3  也常应用于解决鱼类物种的目标检                    即为真正类      (TP, True Positive);
              测与识别中。例如,应用               Inception V3  卷积神          ②若一个实例是正类,但是被预测为负类,
              经网络对     Deep Vision  图像中的蓝鳕、大西洋鲱                即为假负类      (FN, False Negative);
              以及大西洋鲭等          3  种鱼类进行分类,取得了                      ③若一个实例是负类,但是被预测为正类,
                           [41]
              94%  的正确率 。                                      即为假正类      (FP, False Positive);
                   此外,Siddiqui 等    [71]  关于西澳大利亚的温                ④若一个实例是负类,并且被预测为负类,
              带和亚热带水域的           16  种鱼类物种识别研究中,               即为真负类      (TN, True Negative)。
              将传统的非深度学习分类器                SVM  与  3  种  CNN        在此基础上,一系列的分类评价指标如表                     3

              中国水产学会主办  sponsored by China Society of Fisheries                          https://www.china-fishery.cn
                                                            7
   16   17   18   19   20   21   22   23   24   25   26