Page 181 - 《软件学报》2025年第7期
P. 181
3102 软件学报 2025 年第 36 卷第 7 期
缓解性能下降方面的有效性.
(2) Thousand 数据集上的识别准确率和遗忘率评估. 本节还给出了在 Thousand 数据集上的识别准确率和遗忘
率评估实验结果, 实验结果如图 9 和图 10 所示. 从整体的趋势来看, 微调方案同样在完成一轮任务扩展训练后识
别准确率就出现了大幅度下降, 而后下降幅度减小. GFR-SIR 方法则是在前几轮任务扩展训练时准确率下降幅度
较小, 而后面几轮任务的识别准确率下降较大. 但从结果也可以看出, GFR-SIR 相对于微调方法在识别准确率方面
有了较大提升. 此外, PTR-SIR 方法的识别准确率的变化幅度较小, 但任务数量大于 1 时的结果中都出现了先下降
后上升的变化趋势.
100 100
90 90
80 80
70 70
准确率 (%) 60 准确率 (%) 60
50
50
40
40
30 30
20 PTR-SIR 20 PTR-SIR
GFR-SIR GFR-SIR
10 Finetuning 10 Finetuning
0 0
500 600 700 800 900 1 000 500 600 700 800 900 1 000
类别数量 类别数量
(a) 扩展任务数 K=1 (b) 扩展任务数 K=2
100 100
90 90
80 80
70 70
准确率 (%) 50 准确率 (%) 50
60
60
40
PTR-SIR
GFR-SIR 40 PTR-SIR
GFR-SIR
30 30
Finetuning Finetuning
20 20
10 10
0 0
500 600 700 800 900 1 000 500 600 700 800 900 1 000
类别数量 类别数量
(c) 扩展任务数 K=4 (d) 扩展任务数 K=5
图 9 Thousand 数据集上的识别准确率评估实验结果
从具体的实验结果来看, 在该数据集上 3 个方法的第 1 轮任务上的识别准确率都在 92% 左右. 当扩展任务数
为 5 时, 微调方法的性能下降幅度最大, 完成 5 轮任务模型训练时的识别准确率只有 10.21%, 下降了 81.02%. 而
GFR-SIR 方法的识别准确率为 50.27%, 和第 1 轮任务识别准确率相比下降了 40.33%. 尽管本方法相比于微调方
案有了很大提升, 但与初始任务识别准确率相比仍有一定幅度的下降. 一方面是因为扩展任务的难度会随着任务
规模的增大而增大, 而在 Thousand 数据集上总共有 1 000 个类别, 扩展任务的难度比较大. 其次, 由于该数据集中
存在很多戴眼镜的人眼图片, 由于镜片的反射和光线的影响, 使得该数据集的学习难度很大, 因此在增量学习中精
度下降也会较大. 最后, 该数据集中每个类别的虹膜图片只有 10 张, 在模型训练过程中也存在模型训练不充分的

