Page 181 - 《软件学报》2025年第7期
P. 181

3102                                                       软件学报  2025  年第  36  卷第  7  期


                 缓解性能下降方面的有效性.
                    (2) Thousand  数据集上的识别准确率和遗忘率评估. 本节还给出了在              Thousand  数据集上的识别准确率和遗忘
                 率评估实验结果, 实验结果如图          9  和图  10  所示. 从整体的趋势来看, 微调方案同样在完成一轮任务扩展训练后识
                 别准确率就出现了大幅度下降, 而后下降幅度减小. GFR-SIR               方法则是在前几轮任务扩展训练时准确率下降幅度
                 较小, 而后面几轮任务的识别准确率下降较大. 但从结果也可以看出, GFR-SIR                   相对于微调方法在识别准确率方面
                 有了较大提升. 此外, PTR-SIR    方法的识别准确率的变化幅度较小, 但任务数量大于                 1  时的结果中都出现了先下降
                 后上升的变化趋势.


                         100                                    100
                          90                                     90
                          80                                     80
                          70                                     70
                        准确率 (%)  60                            准确率 (%)  60
                                                                 50
                          50
                                                                 40
                          40
                          30                                     30
                          20     PTR-SIR                         20      PTR-SIR
                                 GFR-SIR                                 GFR-SIR
                          10     Finetuning                      10      Finetuning
                          0                                       0
                             500  600   700   800  900  1 000       500   600  700   800   900  1 000
                                         类别数量                                   类别数量
                                      (a) 扩展任务数 K=1                          (b) 扩展任务数 K=2
                         100                                    100
                          90                                     90
                          80                                     80
                          70                                     70
                        准确率 (%)  50                            准确率 (%)  50
                          60
                                                                 60
                          40
                                                    PTR-SIR
                                                    GFR-SIR      40                        PTR-SIR
                                                                                           GFR-SIR
                          30                                     30
                                                    Finetuning                             Finetuning
                          20                                     20
                          10                                     10
                          0                                       0
                             500  600   700   800  900  1 000       500   600  700   800   900  1 000
                                         类别数量                                   类别数量
                                      (c) 扩展任务数 K=4                          (d) 扩展任务数 K=5
                                        图 9 Thousand  数据集上的识别准确率评估实验结果

                    从具体的实验结果来看, 在该数据集上             3  个方法的第   1  轮任务上的识别准确率都在        92%  左右. 当扩展任务数
                 为  5  时, 微调方法的性能下降幅度最大, 完成         5  轮任务模型训练时的识别准确率只有            10.21%, 下降了  81.02%. 而

                 GFR-SIR  方法的识别准确率为      50.27%, 和第  1  轮任务识别准确率相比下降了         40.33%. 尽管本方法相比于微调方
                 案有了很大提升, 但与初始任务识别准确率相比仍有一定幅度的下降. 一方面是因为扩展任务的难度会随着任务
                 规模的增大而增大, 而在       Thousand  数据集上总共有    1 000  个类别, 扩展任务的难度比较大. 其次, 由于该数据集中
                 存在很多戴眼镜的人眼图片, 由于镜片的反射和光线的影响, 使得该数据集的学习难度很大, 因此在增量学习中精
                 度下降也会较大. 最后, 该数据集中每个类别的虹膜图片只有                   10  张, 在模型训练过程中也存在模型训练不充分的
   176   177   178   179   180   181   182   183   184   185   186