Page 149 - 《软件学报》2020年第12期
P. 149

李延超  等:自适应主动半监督学习方法                                                              3815


         3.2.1    对比方法和实验设置
             为了验证提出方法的有效性,将它与基准和一些相关的最新方法进行比较.
             1)   RAND:随机数据选择作为基准方法;
                          [3]
             2)   S-MARGIN :简单间隔算法,旨在查询接近边界的数据样本;
             3)   QUIRE [10] :基于每个样本的信息性和代表性,计算样本不确定性;
             4)   MMC [23] :使用模型变化最大化的思想来查询影响力的样本;
             5)   FASS [21] :结合子模函数和深度学习查询高信息度的样本;
             6)   EE-BMAL [14] :将深度相似性度量引入到批抽样的主动学习中;
             7)   ASCENT [12] :基于深度学习特征抽取的方法选取高影响力的样本.
         3.2.2    分类实验
             在本节中,本文将记录每轮主动查询的准确性.对于 MNIST 数据集,算法在每轮中主动查询 100 个样本;对
         于 CIFAR-10 数据集,算法每轮中主动查询 0.5k 个样本.图中每条曲线显示算法随机独立运行 10 次后的平均性
         能.实验显示,提出的 AdaActive 方法始终比基准方法表现的更好.实验证明了 AdaActive 方法是有效的.在图 2
         中,RAND 方法在 MNIST 数据集上和 MMC 方法在 CIFAR-10 数据集上,算法性能得到提升,但是提升的程度没
         有提出的 AdaActive 方法大.例如:经过 10 轮主动查询后,AdaActive 方法在 MNIST 数据集上的分类准确率为
         99.37%,性能超过所有的对比方法.此外,RAND,S-MARGIN 或 MMC 方法在增加查询的过程中有时会降低性能.
         例如,S-MARGIN 和 MMC 方法分别在 MNIST 和 CIFAR-10 数据集上性能会下降.类似的结果如图 3 所示.
















                                 (a) MNIST                                    (b) CIFAR-10
                           Fig.2    Comparison results of different active learning algorithms by
                            taking MT model as the base classification classifier on the datasets
                               图 2   各算法在使用 MT 模型作为元学习器的分类结果















                                  (a) MNIST                                 (b) CIFAR-10
                           Fig.3    Comparison results of different active learning algorithms by
                             taking best kNN as the base classification model on the datasets
                                图 3   各算法在使用 kNN 作为元学习器的分类结果
   144   145   146   147   148   149   150   151   152   153   154