Page 179 - 《软件学报》2021年第9期
P. 179

杨博  等:一种协同过滤式零次学习方法                                                              2803


         方面.第 4 节采用实验验证本文方法在各项任务中的表现并进行分析.最后一节对本文工作进行总结,并进一步
         对将协同过滤思想引入零次学习的未来研究进行分析和展望.
         1    零次学习定义

             在零次学习中,已知类别集合记作 S ,新类别集合记作 U,S 和 U 不相交,即 S∩U=∅.对于 S∪U 集合中的每个
                                          m
         类 k,可表示为一个语义特征向量 c k ,c k ∈  ,m 为语义空间维度,可以由类别属性、词向量或类别描述等语义知识
         构成.零次学习可分为传统零次学习任务和广义零次学习任务:
             (1)  在传统零次学习任务中,训练集记作 D =            {( ,x y s i  )} i= s 1  ,其中, x 和 y 分别表示已知类别样本与其类别
                                                         N
                                                                     s
                                                     s
                                                                 s
                                                    i
                                                                     i
                                                                 i
                                                s
                 标签,N s 表示训练集样本总量;测试集记作 D =            {}x i u  N i= u 1  ,其中, x 表示测试样本,N u 表示测试集样本总
                                                                  u
                                                                  i
                                                    s
                                                                    u
                                                                                               u
                 量.传统零次学习任务旨在学得一个映射函数 f,对 D u 中的每个 x ,给出其在集合 U 上的预测结果 y ;
                                                                                               i
                                                                    i
                                                                        N
                                                       N
             (2)  在广义零次学习任务中,训练集为 D −           {( ,x y i s )} ,测试集为 D ∪ {}x i s  i= e 1  ,表示从原始训练集中划分出
                                                  s
                                                       e
                                                       i=
                                                        1
                                              s
                                                                  u
                                                  i
                                  s
                 N e 个已知类别样本 x 至测试集中.广义零次学习任务同样旨在学得一个映射函数 f,对测试集中每个
                                  i
                 样本,给出其在集合 S∪U 上的预测结果,相较于传统零次学习任务难度更高.
         2    相关工作
             从模型训练过程是否包含新类别样本的角度,现有零次学习方法可分为归纳式零次学习                                [11−13] 和直推式零
         次学习   [14−16] 两大类:前者的训练过程不包含新类别样本,后者包含新类别样本但不包含其标签.尽管直推式零次
         学习可以有效缓解由于训练样本和测试样本分布不同导致的领域漂移问题,但在模型学习过程中获取到所有
         新类别样本这一假设不太符合实际场景,因此,本文工作主要聚焦于归纳式零次学习.在零次学习任务中,由于
         训练集样本类别和测试集样本类别不相交,所以零次学习任务的实现通常依赖于引入外部语义知识,进而构建
         视觉空间和语义空间的映射关系,如图 1 所示.

                      Fig.1    Compatibility learning framework between visual space and semantic space
                                   图 1   视觉空间与语义空间的匹配学习框架

             根据嵌入空间的不同选择,现有归纳式零次学习方法可分为 3 类.
             •   第 1 类方法以 Lampert 等人为代表,选择语义空间作为嵌入空间,将样本的视觉特征嵌入至语义空间,
                 与类别原型计算距离并进行匹配            [17−19] ;
             •   然而,Radovanovic 等人  [20] 发现:第 1 类方法在使用语义空间作为嵌入空间时,需要将高维视觉特征做
                 低维映射,使得空间发生萎缩,点与点之间更加稠密,加重由于最近邻计算产生的枢纽点问题.因此,第
                 2 类方法选择更高维的视觉空间作为嵌入空间,建立从类别语义原型到视觉特征空间的映射,在一定
                 程度上缓解枢纽点问题         [12,21,22] ;
             •   此外,以 Changpinyo 等人为代表的最后一类方法选择除视觉空间和语义空间之外的第三方空间作为
                 嵌入空间,视觉特征及语义原型都向其做映射                [23-26] .
             零次学习的特点与推荐任务相似,面临冷启动和矩阵稀疏问题.由于模型在训练过程中未见过新类别样本,
   174   175   176   177   178   179   180   181   182   183   184