Page 400 - 《软件学报》2024年第6期
P. 400
2976 软件学报 2024 年第 35 卷第 6 期
于密度的聚类改进算法, 并探讨其在推荐领域的应用. Ferdaous 等人 [8] 利用网络相关性和特征聚类, 推出一种好
友推荐算法. Tey 等人 [9] 为解决推荐中的冷启动问题, 采用一种融合社交影响力的聚类算法. 王俊等人 [10] 对 CF
算法加以改进, 提出一种基于用户项目聚类的可扩展方法. Xu 等人 [11] 将用户间的信任关系进行聚类, 并将聚类
结果融入 CF 算法中进行推荐. 但这些模型所使用的信任值均由数据集直接给出, 导致数据来源成为这类模型
的最大障碍.
线性回归也是推荐中的常用技术, 这得益于它在拟合函数和趋势分析上具有的独特优势. 文献 [12] 通过最小
二乘法等方式计算出每种浏览行为的权重, 构建多种浏览行为的多元线性回归函数, 再以每种浏览行为的权重与
其量化特征做内积, 获得用户对项目的偏好得分. 刘兴波等人 [13] 提出一种基于双向线性回归的监督离散型跨模态
散列方法, 该方法仅用一个稳定的映射矩阵来描述散列码与相应标签间的线性回归关系, 提升了跨模态散列学习
的精度和稳定性. 基于线性回归的推荐大多是根据浏览项目内容大小, 对浏览时间和访问次数进行但用户的多元
化属性间大都不存在线性关系, 导致基于线性回归的方法具有较大的局限性.
循环神经网络 (recurrent neural network, RNN) 作为一种优秀的序列问题处理技术, 能非线性化地拟合多元化
属性, 被广泛运用到各种推荐 [14,15] 中. 比如, 动态回归模型 (dynamic regression model) 使用 RNN 来优化自身, 使其
的整体框架, 如图
在下一个篮子推荐 [16] 中的效果得到很大的提升. 但 RNN 对数据的要求较高, 需要数据有统一格式, 比如一维向量、
二维矩阵、三维张量等, 即欧氏空间的数据, 很难处理类似图结构等复杂混合型的数据. 这些问题的提出, 使得主
要解决图论问题的 GNN (graph neural network) 方法开始得到很多推荐领域学者的关注. 但直到 2014 年, Perozzi
等人 [17] 提出了 DeepWalk, 意味着图表示学习技术在这个深度学习时代才正式被激活, 之后便得到更为深入的应
用. Wu 等人 [18] 提出深度影响传播模型 (DiffNet++) 来建模社交推荐中的递归动态社交扩散过程, 重点考虑了用户
之间的社交网络以及用户和项目间的兴趣网络.
之后, 为使图表示学习能更好地应用于协同过滤的相关研究中, 且在嵌入过程中尽可能地保留用户-项目之间
的潜在特征, Wang 等人 [3] 运用 GCN 技术来实现协同过滤, 提出 NGCF 模型. 在此基础上, Wu 等人 [19] 认为 GCN
具有不必要的复杂性, 通过消除非线性和多个权重矩阵, 提出一个简易的 GCN 模型. 而 He 等人 [4] 在 NGCF 的基
础上, 更大程度地去除特征融合及非线性转化的过程, 提出一种轻量级的 GCN. 这些工作给予了很多学者启示, 更
多相关且性能更好的推荐模型 [20,21] 不断推出.
上述已有研究表明, 大多数协同过滤推荐模型主要考虑如何对基础信息进行填充或引入辅助信息加以利用,
未更大程度地挖掘在用户与项目基础信息中所蕴藏的深层信息; 此外, 在抽象编码用户行为表示时, 也仅实现最显
式的关系, 未考虑更高阶的用户-项目交互关系, 且尽管 GCN 技术在推荐中表现优异, 但对其一些关键构件的必要
性仍存在争议. 因此, 本文提出 LG_APIF 模型来捕捉用户的整体兴趣, 先利用较为轻量的传统技术来挖掘用户的
自适应周期和兴趣量因子等深度信息, 再进一步归结行为规律, 预测用户的兴趣项目类型, 以建立用户-类型-项目
三元图结构信息, 最终结合相对轻量的 GCN 技术构建推荐模型.
3 融合深度信息的 GCN 自适应推荐策略
传统的协同过滤推荐模型, 大多数将侧重点放在用户的相似性上, 即用户之间是否浏览了同一类项目, 或项目
的相似性上, 即项目之间是否存在功能或特征上的替换性及互补性. 但在用户和项目基础特征中, 还蕴藏着很多对
推荐效果起着重要作用的深度信息, 它们十分有助于推荐系统的发展. 因此, 提出一种轻量级推荐模型 LG_APIF,
来挖掘与利用这些深度信息, 并最终实现推荐.
下面先给出本文模型 LG_APIF 1 所示; 再详细介绍兴趣模型构建、自适应周期预测、兴趣
量因子解析以及融合深度信息的轻量级 GCN 推荐. 模型 LG_APIF 的工作原理如下.
1) 构建兴趣模型. 将用户的历史记录转化成以时间间隔为单位的行为记忆序列, 结合艾宾浩斯遗忘曲线构建
可计算用户兴趣程度的兴趣模型, 同时引入并应用自适应周期和兴趣量因子这两个重要的深度信息.
2) 预测自适应周期. 结合转化后的行为记忆序列, 将同种项目类型下不同用户间的兴趣周期进行聚类, 再利用