Page 186 - 《软件学报》2021年第9期
P. 186
2810 Journal of Software 软件学报 Vol.32, No.9, September 2021
s,h 分别表示未知类别分类准确率、已知类别分类准确率以及调和准确率.有些基准算法仅针对传统零次学习
任务,表中所列基准算法均为进行过广义零次学习任务的算法.从表中可以看出:所有基准模型很难在已知类别
和新类别的准确率上达到一个均衡的表现,并且新类别的准确率也均低于其在传统零次学习任务中的结果.例
如:CONSE 方法在已知类别的分类准确率(s)大幅超过其在新类别的分类准确率(u),且 u 值非常低,几乎无法对
新类别样本进行正确预测.这种现象是由实验性质导致的,由于每张样本都要向所有类别去做预测,而已知类别
和新类别中可能存在非常相似的类别,以 AWA2 数据集为例,新类别中的蓝鲸与已知类别中的虎鲸在视觉特征
上较为相似,这种情况提升了分类的难度,更加考验算法能否有效准确地区分已知类别和新类别中差异较小的
那些类别.CF-ZSL 方法在这种实验设置下,相较于各个基准模型仍可获得较好的结果;同时,在未知类别准确率
指标上总能达到更优的结果.
Table 6 Compare the classification accuracy under the generalized ZSL setting (%)
表 6 比较广义零次学习任务分类准确率 (%)
SUN CUB AWA2
方法
u s h u s h u s h
CONSE 6.8 39.9 11.6 1.6 72.2 3.1 0.5 90.6 1.0
SSE 2.1 36.4 4.0 8.5 46.9 14.4 8.1 82.5 14.8
DEVISE 16.9 27.4 20.9 23.8 53.0 32.8 17.1 74.7 27.8
SJE 14.7 30.5 19.8 23.5 59.2 33.6 8.0 73.9 14.4
ESZSL 11.0 27.9 15.8 12.6 63.8 21.0 5.9 77.8 11.0
SYNC 7.9 43.3 13.4 11.5 70.9 19.8 10.0 90.5 18.0
ALE 21.8 33.1 26.3 23.7 62.8 34.4 14.0 81.8 23.9
PSR 20.8 37.2 26.7 24.6 54.3 33.9 20.7 73.8 32.3
ZSKL 20.1 31.4 24.5 24.2 63.9 35.1 18.9 82.7 30.8
MLSE 20.7 36.4 26.4 22.3 71.6 34.0 23.8 83.2 37.0
CF-ZSL 29.4 45.8 35.8 36.3 72.9 48.5 33.3 82.0 47.4
4.6 基于局部特征的零次学习实验
现有零次学习方法多数基于整张图片提取的全局特征作为视觉特征,但是全局特征着重捕获图像中整体
信息,忽略了局部区域的判别性差异,使用其表示细粒度图像可能会导致次优结果.与之相比,局部区域特征更
关注图像中的一些重点区域,可能会捕获与类别语义描述相关的更多局部信息,特征更具判别性.在细粒度 CUB
数据集中,局部区域由多位领域专家进行标注.图 4 为 CUB 数据集中标注的局部区域,一般可选取背部、喙、腹
部、胸部、腿部、翅膀和尾部这 7 个主要局部区域用于概括整张图片图像的视觉特征.
Fig.4 Local regions in CUB image [35]
图 4 CUB 数据集图像局部区域 [35]
本文希望尝试使用更加细粒度的局部特征进行零次学习实验,结果见表 7.本文在这里使用的对比算法均
为使用局部特征的零次学习方法,是近两年发表在计算机视觉领域顶级会议上的代表性工作.从表中可以看出:
相较于使用全局特征的 CF-ZSL 方法,实验结果由 66.2%提升至 80.2%,实现了 14%的准确率提升.而相较于其他
使用局部特征的基准算法,CF-ZSL 方法能够达到最高的准确率指标.由此可证明:针对 CUB 这类细粒度数据集,
零次学习模型应该使用更加细粒度的局部特征作为图像视觉特征,识别效果更加精准.