Page 180 - 《软件学报》2021年第9期
P. 180
2804 Journal of Software 软件学报 Vol.32, No.9, September 2021
对新类别样本的分类属于冷启动;且样本标签矩阵中只有样本真实所属类别位置不为空,矩阵非常稀疏.在推荐
任务中,冷启动指为没有历史行为数据的新用户做个性化推荐,矩阵稀疏指大量用户只与一小部分物品完成交
互,表现在用户-物品评分矩阵中存在大量空值.Goldberg [27] 于 1992 年首次提出了协同过滤的概念,它的优势在
于能够通过评估用户关联及商品关联,挖掘交互矩阵蕴含的信息.协同过滤算法 [28,29] 的本质是考虑大量用户的
偏好信息来对某一用户的偏好作出预测,通过计算用户相似性及物品相似性,可以为某些没有历史行为数据的
新用户及新物品完成推荐.此外,将评分矩阵分解为有效的用户特征矩阵和物品特征矩阵,利用低维、连续特征
矩阵的稠密性,缓解矩阵稀疏导致的评分预测不准确问题.协同过滤推荐可分为 3 种:基于用户的协同过滤、基
于物品的协同过滤以及基于模型的协同过滤.基于用户的协同过滤通过观测用户与不同物品的交互,评估用户
之间相似程度,使用高相似度用户的偏好信息进行推荐.基于物品的协同过滤的原理与前者类似,主要思想是评
估物品之间相似程度,将高度相关的物品推荐给用户.基于模型的协同过滤采用不同的机器学习思想建模推荐
任务,主要工作有:以文献[30]为代表的关联规则方法;以 Gibbs 抽样算法 [31] 为代表的聚类算法;以及使用奇异值
分解 [32] 、降低矩阵稀疏性的矩阵分解算法等.
零次学习需要通过引入外部语义知识建立类间关联.知识图谱是一种显式地组织知识及知识关联的数据
[8]
结构,通过为零次学习引入知识图谱中的结构化信息和复杂关系,可以更好地进行知识迁移.Wang 等人 于
2018 年提出将领域知识图谱与语义向量相结合,知识图谱中以类别作为节点,节点初始表示为类别的词向量特
征,图谱中的边采用知识库中不同类别之间的关系.通过利用图卷积神经网络(graph convolutional neural
network,简称 GCN)在不同类别之间迁移信息,最后每个节点的输出特征代表对此类别的分类参数(即全连接层
参数).实验结果证明,基于语义向量和知识图谱的方法比仅仅基于语义向量的方法效果更加优异.同年,
Kampffmeyer 等人 [33] 指出:多层 GCN 结构需要传递并吸收图中较远节点的知识,由于在每一层都要执行
Laplacian 平滑,这种操作会稀释知识从而导致性能降低.文中提出的基于密集图的传播模型(dense graph
propagation)通过建立节点与较远邻居的直连边,来更好地利用知识图谱的层次图结构.
3 模型描述
本文借鉴协同过滤算法的思想,将零次分类建模为矩阵填充问题,利用已知类别标签矩阵中非空位置信息
指导图像视觉特征以及类别语义特征的学习.模型整体框架如图 2 所示,分为视觉特征抽取、语义知识表示以
及协同过滤式零次学习这 3 个主要模块.本文采用深度卷积模型作为视觉特征提取部分的网络架构,为图像样
本提取像素级特征;语义知识表示部分涉及用于知识迁移的语义图构建以及知识表示学习过程,建立已知类别
和新类别间关联,借助图神经网络进行图上的信息传递,为每个节点(类别)学得更好的特征表示;协同过滤式零
次学习部分描述如何使用协同过滤思想建模零次学习过程并解决零次分类问题,是本文的核心模块.
Fig.2 Overall framework of collaborative filtering based zero-shot learning
图 2 协同过滤式零次学习的总体框架