Page 250 - 《软件学报》2025年第4期
P. 250

1656                                                       软件学报  2025  年第  36  卷第  4  期


                 过程中的训练轮次有关, 可由用户权衡选择遗忘的用时.
                    从可用性来看, 继续训练和参数编辑的方法可用性较高, 具体见“可用性”列. 继续训练方法                           DeltaGrad  在某些
                 轮次计算精确梯度来更新参数, 在其他轮次采用近似方法来计算梯度以减少用时, 通过训练较大程度地保障了模
                 型的可用性. Unrolling SGD  在对模型进行微调时, 考虑模型在剩余数据集和遗忘数据集上的性能差异来设计损失
                 函数, 使得模型保有较高的可用性. 实验中使用              CR  和  Sekhari 方法时, 均用  LCODEC  来缩小要编辑的参数范围,
                 故  CR  和  Sekhari 方法得到的遗忘后模型与原模型在测试集上表现有较高的一致度.
                    从完成度来看, 继续训练、混合方法和参数编辑的机器遗忘方法完成度较高, 具体见“完成度”列. 完成度比较
                 DIST outpu 和 t  DIST para , 参数编辑的方法  CR  和  Sekhari 均只选择了一部分参数进行更新, DIST par 较小, 但从输出分
                                                                                          a
                                     n
                 布上看, CR  得到的   M unlear 更接近  M retrain . 在基于训练的方法中, DeltaGrad  基本还原了模型重新训练过程, 与
                 M retrai 更接近, 而  Finetune 和  Unrolling SGD  均为在  M 0 基础上继续训练, 它们得到的  M unlear 在本文评估的所有
                                                                                         n
                     n
                 方法中处于中下水平. 混合方法          SISA  会对涉及遗忘数据集的子模型进行重训练, 在与之相同的数据分块训练模
                 式下, 其遗忘后的模型与重训练模型理论上一致, 只是因分块时数据分布的随机性而在性能上有细微差异.
                    结合以上    3  个方面, 继续训练类方法速度较慢, 但可用性和完成度较高, 且表现比较稳定. 输入编辑和输出编
                 辑类方法可用性与完成度不高. 参数编辑的方法速度较快, 可用性和完成度也属于中上, 适用于需要快速得到
                 M unlear 而对模型性能要求较低的场景, 与第        2.4  节和第  3.4  节的结论相符.
                     n

                 6.2.2    标签总数影响分析
                    对单个标签进行遗忘时, 数据集标签总数对机器遗忘方法的效果影响如何? 为了探究该问题, 本文在一组标
                 签遗忘数不变, 标签总数改变的场景下进行了实验                (具体实验设置见第       6.1.4  节), 图  3  为实验结果, 图中所示为各
                 方法在所有数据集上实验结果的均值.

                                        100
                    10 5
                                         80                  0.3                  0.020
                    10 4
                   Speedup  10 3 2      ACC test  60        DIST output  0.2     DIST para  0.015
                    10
                                         40
                    10 1                                     0.1
                                         20                ACC remained
                    10 0                                                          0.010
                                                             0
                    10 -1                 0
                        20 40 60 80  100    20 40 60 80  100    20  40  60  80  100   20  40  60  80  100
                            标签总数               标签总数                 标签总数                  标签总数
                     Finetune  Unrolling SGD  SISA  DeltaGrad  Unlearnable  Linear Filtration  CR  Sekhari  Chundawat
                                             图 3 标签总数改变时各方法性能表现

                    为了更准确地探究标签总数与机器遗忘方法性能之间的关系, 本文计算了不同标签总数与不同评价指标间
                 的  Spearman  相关系数, 结果如表  14  所示. Spearman  相关系数在  [−1, 1] 之间, Spearman  相关系数为负表示负相关,
                 反之为正相关, 绝对值越大, 则相关性越强. 如对于机器遗忘方法                  Finetune, 其  Speedup  和标签总数之间的相关系数
                 为−1.000 0, 说明两者成明显的负相关关系.

                                    表 14 不同标签总数与不同评价指标间的              Spearman  相关系数

                    机器遗忘方法          Speedup     ACC test                ACC deleted  DIST output  DIST para
                      Finetune      −1.000 0   −0.900 0    −0.700 0     −0.900 0     0.700 0    0.900 0
                    Unrolling SGD   −1.000 0   −0.800 0    −0.300 0     −0.800 0     0.500 0    0.974 7
                       SISA         −0.800 0   −0.900 0    −0.300 0     −0.600 0     0.500 0      -
                      DeltaGrad     −0.800 0   −0.900 0    −0.288 7     −0.900 0     0.000 0      -
                     Unlearnable    −1.000 0   −0.707 1    −1.000 0     −0.707 1     0.400 0    −0.359 1
                    Linear Filtration  −0.300 0  0.000 0   −0.894 4      0.000 0     0.300 0      -
                        CR          −0.300 0   −0.894 4    −0.866 0     −0.894 4     0.600 0    0.410 4
                      Sekhari       0.600 0    −0.353 6    −0.866 0     −0.353 6     0.600 0    0.410 4
                     Chundawat      −0.300 0   −0.900 0    −0.366 7     −0.259 3     0.400 0    −0.210 8
   245   246   247   248   249   250   251   252   253   254   255