Page 149 - 《软件学报》2020年第12期
P. 149
李延超 等:自适应主动半监督学习方法 3815
3.2.1 对比方法和实验设置
为了验证提出方法的有效性,将它与基准和一些相关的最新方法进行比较.
1) RAND:随机数据选择作为基准方法;
[3]
2) S-MARGIN :简单间隔算法,旨在查询接近边界的数据样本;
3) QUIRE [10] :基于每个样本的信息性和代表性,计算样本不确定性;
4) MMC [23] :使用模型变化最大化的思想来查询影响力的样本;
5) FASS [21] :结合子模函数和深度学习查询高信息度的样本;
6) EE-BMAL [14] :将深度相似性度量引入到批抽样的主动学习中;
7) ASCENT [12] :基于深度学习特征抽取的方法选取高影响力的样本.
3.2.2 分类实验
在本节中,本文将记录每轮主动查询的准确性.对于 MNIST 数据集,算法在每轮中主动查询 100 个样本;对
于 CIFAR-10 数据集,算法每轮中主动查询 0.5k 个样本.图中每条曲线显示算法随机独立运行 10 次后的平均性
能.实验显示,提出的 AdaActive 方法始终比基准方法表现的更好.实验证明了 AdaActive 方法是有效的.在图 2
中,RAND 方法在 MNIST 数据集上和 MMC 方法在 CIFAR-10 数据集上,算法性能得到提升,但是提升的程度没
有提出的 AdaActive 方法大.例如:经过 10 轮主动查询后,AdaActive 方法在 MNIST 数据集上的分类准确率为
99.37%,性能超过所有的对比方法.此外,RAND,S-MARGIN 或 MMC 方法在增加查询的过程中有时会降低性能.
例如,S-MARGIN 和 MMC 方法分别在 MNIST 和 CIFAR-10 数据集上性能会下降.类似的结果如图 3 所示.
(a) MNIST (b) CIFAR-10
Fig.2 Comparison results of different active learning algorithms by
taking MT model as the base classification classifier on the datasets
图 2 各算法在使用 MT 模型作为元学习器的分类结果
(a) MNIST (b) CIFAR-10
Fig.3 Comparison results of different active learning algorithms by
taking best kNN as the base classification model on the datasets
图 3 各算法在使用 kNN 作为元学习器的分类结果