Page 23 - 《水产学报》2025年第11期
P. 23
朱国平,等 水产学报, 2025, 49(11): 119102
表 3 模型评价方法
Tab. 3 Model evaluation method
评价指标 描述 公式化描述 优缺点
evaluation metrics description formula description advantages and disadvantages
准确率 正确分类的样本数与总样本数之比 TP+TN 在正负样本不平衡的情况下,其值
Accuracy =
Accuracy TP+FN+FP+TN 可能无实际意义
精确率 正确分类的正例个数占分类为正例的 TP 衡量的是分类器的查准率
Precision =
Precision 实例个数的比例 TP+FP
召回率 正确分类的正例个数占实际正例个数 TP 衡量的是分类器的查全率
Recall =
Recall 的比例 TP+FN
F分数 衡量整体性能 2×Precision×Recall 对精确率和召回率进行整体评价
F-score F- score = Precision+Recall
多分类,计算n个二分类的 F 1 score,n 没有考虑到数据的数量,容易受到
宏观F 1 1 ∑ n i
MacroF 1 = F
Macro F 1 个 F 1 score的平均值即为Macro F1 n i=1 1 识别性高(高召回率、高精确率)的类
别影响
微观F1 ①先计算出所有类别的总的精确率和 P micro ×R micro 适用于数据分布不平衡的情况
MacroF 1 = 2×
Micro F 1 召回率,记为 P micro 和 R micro P micro +R micro
②然后利用 F 1 计算公式,计算出来的
F 1 值即为Micro F 1
真正类率 分类器正确分类的正实例占所有正实 TPR = TP 这三者引入的目的是为AUROC曲线
TPR 例的比例 TP+FN 进行描述
负正类率 分类器错认为正类的负实例占所有负 FPR = FP
TNR 实例的比例 FP+TN
真负类率 分类器正确分类的负实例占所有负实 TNR = TN
TNR 例的比例 TP+FN
接受者操作特征曲 接收者操作特征(ROC)曲线下的面积 以一组阈值计算一组 (FPR,TPR值,以 当测试集中的正负样本的分布变换
线下面积 FPR为横坐标、TPR为纵坐标,计算ROC 时,ROC曲线能够保持不变
AUROC 曲线下面积
究采取迁移学习的思想,使用开源数据库数据 以及分析凭借现有的技术均可实现即时的判别;
[87]
预训练模型,进而在数据量较少的情况下获得 且可同步由图片中获得体长等信息 。但相较
较优的分类器性能 [83-84] 。而基于鱼类外型及鱼 于基于鱼类图片数据的深度神经网络鱼类种群
类耳石几何形态学的鱼类物种识别研究与种群 判别,基于鱼类耳石的种群判别具有远超前者
判别研究所获取的数据均具有低维的特点。因 的判别准确性。集成模型能够较好地提高机器
此,在数据处理上采取的大多为传统机器学习 模型的泛化能力,针对目前鱼类物种识别与种
方法。根据应用场景的不同,最优的分类器也 群判别模型普遍存在的泛化能力弱的缺点,集
[24]
不相同;但总体来说,LDA、QDA 与 SVM 似 成模型可能会是最终答案 。在此前的研究中,
乎能获得较优的分类性能。 集成模型已广泛应用于预测物种分布模型中,
在鱼类物种识别与种群判别研究中,有学 较好地解决了模型泛化问题;因此,可以合理
者提出,多源数据可能会取得更好的结果。多 推测,集成模型在鱼类物种识别与种群判别中
源数据能够尽可能全面地描述鱼类不同物种或 的应用也大有可为。
种群之间的差异,这给机器学习分类器提供了 机器学习在鱼类物种与种群识别中展现了
更多可供学习的特征,进而得到泛化能力较好 巨大的优势,但也面临着巨大的挑战,即海洋
的模型 。此外,值得注意的是,基于深度神 数据的数量和复杂性将呈数量级地增加,如此
[85]
经网络的鱼类种群判别研究较少,原因可能是 大规模的数据收集与标注工作量将极为巨大。
该方法仅能适应某些情况,如同种鱼类的不同 目前,数据收集与标注更多地停留在人工阶段,
种群之间外观差异较明显时,其仍有着巨大的 数据收集与标注速度与海量的海洋数据处理时
[86]
应用前景 。基于鱼类图片数据的深度神经网 间之间严重失衡将制约机器学习在其中的应
[14]
络鱼类种群判别,相较于基于鱼类耳石的种群 用 。深度学习具有自动学习与提取数据特征
判别,不伤害鱼类生命,且图像的拍摄、传输 的能力,更适应于将来愈发复杂的数据,但要
中国水产学会主办 sponsored by China Society of Fisheries https://www.china-fishery.cn
9

