Page 23 - 《水产学报》2025年第11期
P. 23

朱国平,等                                                                水产学报, 2025, 49(11): 119102


                                                     表 3    模型评价方法
                                               Tab. 3    Model evaluation method
                  评价指标                 描述                       公式化描述                       优缺点
               evaluation metrics    description              formula description     advantages and disadvantages
              准确率           正确分类的样本数与总样本数之比                        TP+TN           在正负样本不平衡的情况下,其值
                                                       Accuracy =
              Accuracy                                         TP+FN+FP+TN         可能无实际意义
              精确率           正确分类的正例个数占分类为正例的                     TP                衡量的是分类器的查准率
                                                       Precision =
              Precision     实例个数的比例                            TP+FP
              召回率           正确分类的正例个数占实际正例个数                   TP                  衡量的是分类器的查全率
                                                       Recall =
              Recall        的比例                              TP+FN
              F分数           衡量整体性能                            2×Precision×Recall   对精确率和召回率进行整体评价
              F-score                                  F- score =  Precision+Recall
                            多分类,计算n个二分类的     F 1   score,n                         没有考虑到数据的数量,容易受到
              宏观F 1                                            1 ∑ n  i
                                                       MacroF 1 =   F
              Macro  F 1    个 F 1  score的平均值即为Macro F1         n  i=1  1           识别性高(高召回率、高精确率)的类
                                                                                   别影响
              微观F1          ①先计算出所有类别的总的精确率和                     P micro ×R micro  适用于数据分布不平衡的情况
                                                       MacroF 1 = 2×
              Micro  F 1    召回率,记为   P micro 和 R micro           P micro +R micro
                            ②然后利用   F 1 计算公式,计算出来的
                            F 1 值即为Micro   F 1
              真正类率          分类器正确分类的正实例占所有正实           TPR =  TP                   这三者引入的目的是为AUROC曲线
              TPR           例的比例                            TP+FN                  进行描述
              负正类率          分类器错认为正类的负实例占所有负           FPR =  FP
              TNR           实例的比例                           FP+TN
              真负类率          分类器正确分类的负实例占所有负实           TNR =  TN
              TNR           例的比例                            TP+FN
              接受者操作特征曲 接收者操作特征(ROC)曲线下的面积              以一组阈值计算一组 (FPR,TPR值,以       当测试集中的正负样本的分布变换
              线下面积                                     FPR为横坐标、TPR为纵坐标,计算ROC 时,ROC曲线能够保持不变
              AUROC                                    曲线下面积

              究采取迁移学习的思想,使用开源数据库数据                             以及分析凭借现有的技术均可实现即时的判别;
                                                                                                [87]
              预训练模型,进而在数据量较少的情况下获得                             且可同步由图片中获得体长等信息 。但相较
              较优的分类器性能          [83-84] 。而基于鱼类外型及鱼             于基于鱼类图片数据的深度神经网络鱼类种群
              类耳石几何形态学的鱼类物种识别研究与种群                             判别,基于鱼类耳石的种群判别具有远超前者
              判别研究所获取的数据均具有低维的特点。因                             的判别准确性。集成模型能够较好地提高机器
              此,在数据处理上采取的大多为传统机器学习                             模型的泛化能力,针对目前鱼类物种识别与种
              方法。根据应用场景的不同,最优的分类器也                             群判别模型普遍存在的泛化能力弱的缺点,集
                                                                                      [24]
              不相同;但总体来说,LDA、QDA                  与  SVM  似     成模型可能会是最终答案 。在此前的研究中,
              乎能获得较优的分类性能。                                     集成模型已广泛应用于预测物种分布模型中,
                   在鱼类物种识别与种群判别研究中,有学                          较好地解决了模型泛化问题;因此,可以合理
              者提出,多源数据可能会取得更好的结果。多                             推测,集成模型在鱼类物种识别与种群判别中
              源数据能够尽可能全面地描述鱼类不同物种或                             的应用也大有可为。
              种群之间的差异,这给机器学习分类器提供了                                 机器学习在鱼类物种与种群识别中展现了
              更多可供学习的特征,进而得到泛化能力较好                             巨大的优势,但也面临着巨大的挑战,即海洋
              的模型 。此外,值得注意的是,基于深度神                             数据的数量和复杂性将呈数量级地增加,如此
                     [85]
              经网络的鱼类种群判别研究较少,原因可能是                             大规模的数据收集与标注工作量将极为巨大。
              该方法仅能适应某些情况,如同种鱼类的不同                             目前,数据收集与标注更多地停留在人工阶段,
              种群之间外观差异较明显时,其仍有着巨大的                             数据收集与标注速度与海量的海洋数据处理时
                       [86]
              应用前景 。基于鱼类图片数据的深度神经网                             间之间严重失衡将制约机器学习在其中的应
                                                                 [14]
              络鱼类种群判别,相较于基于鱼类耳石的种群                             用 。深度学习具有自动学习与提取数据特征
              判别,不伤害鱼类生命,且图像的拍摄、传输                             的能力,更适应于将来愈发复杂的数据,但要

              中国水产学会主办  sponsored by China Society of Fisheries                          https://www.china-fishery.cn
                                                            9
   18   19   20   21   22   23   24   25   26   27   28