Page 417 - 《软件学报》2024年第6期
P. 417
钱忠胜 等: 融合自适应周期与兴趣量因子的轻量级 GCN 推荐 2993
点上表现不一致, 因此仅考虑模型 BPR 和 FAWMF 在 MovieLens 上的表现. 另外, 由于 Last.fm 和 Yelp 缺少模型
FAWMF 需要的相关信息, 因此仅考虑该模型在 Douban 和 MovieLens 上的表现.
由表 4 可知, 相比于其他模型, 本文模型 LG_APIF 在 Precision, Recall 和 NDCG 上均有较大幅度的提升, 整
体平均提升达到 1.53%. 从数据集的角度上看: 在 Douban 上的表现明显要优于其他各种模型, 平均提升 2.43%; 在
Last.fm 和 MovieLens 上分别平均提升 1.32% 和 0.85%; 仅在 Yelp 数据集下, 改善效果不是很理想. 从指标值的角
度上看: Precision 值、Recall 值和 NDCG 值分别平均提升 2.11%, 1.01% 和 1.48%.
整体来看, 在 Last.fm, Douban 与 MovieLens 上, 模型 LG_APIF 的指标值均高于其他模型; 在 Yelp 上, 模型
2
LG_APIF 虽较 S -MHCN 稍逊色, 但整体指标值仍均明显优于其他对比模型. 主要优势有:
1) 与 8 个对比算法相比, 提出的模型 LG_APIF 在推荐性能方面整体上有较大幅度提升. 特别是在 Douban 数
据集下, 优势更加明显, 我们认为这是因为电影项目在分类时, 具有明确的分类标准, 不同的电影表现出的情感和
主题有明显区别, 故用户受到分类标签影响更大. 某用户喜欢看青春偶像剧, 那他对该类型电影关注度也可能会更
高; 某用户喜欢某位明星, 那他可能会对该明星主演的电影毫不抗拒. 当然, 为验证模型在电影领域应用的适用性,
我们还特别增加了 MovieLens 数据集, 该数据集同样记录有关用户-电影项目的数据信息, 由表 4 可知, 模型
在其中的
LG_APIF 在该数据集下表现依然优秀, 其原因与上述一致.
2) 在 Last.fm 数据集下, 提出的模型 LG_APIF 表现出来的优势也很明显, 我们认为这是由于音乐在分类方式
上界限比较明显, 比如民谣和摇滚音乐, 这两种音乐类型具有很大区别. 另外, 音乐的听取意向更易表达出近段时
间内的兴趣倾向. 因此, 这再一次验证了本模型对项目类型具有严格的分类标准. 相对于对比模型, 模型 LG_APIF
在产生推荐结果之前就已经限定了用户的兴趣范围 (即, 项目类型), 所以, 本模型对噪声的反应并不会太敏感, 即
具有很好的稳定性, 从而使得本文模型在召回率方面表现突出.
3) 为更准确评估各推荐模型推荐列表中的项目排名质量, 还对各推荐模型的 NDCG 值进行了计算. 由表 4 可
知, 模型的 NDCG 指数越高, 表明模型推荐的项目与用户最终所选择项目的相关性越高, 模型输出的推荐列表就
越符合用户需求. 在其中 3 种数据集实验中, 模型 LG_APIF 的效果均优于其他对比模型, 这也表明推荐系统中的
兴趣量因子和兴趣类型的确定对于及时发现并满足用户需求非常重要.
2
此外, 在 Yelp 中, 尽管模型 LG_APIF 的指标值高于某些模型, 但并不是最高, 尤其对比模型 S -MHCN 来说,
本文的模型存在一些不足之处. 本文模型 LG_APIF 在 Yelp 数据集上的表现一般, 其主要原因是由于用户对餐厅
的分类以及评分信息敏感性不高, 在餐厅类型标签的设置上一般比较模糊. 比如, 面食店也卖盖浇饭, 西餐厅中也
会有少量的中餐. 另外, 用户的评分一般主要针对餐厅某个方面的不足, 用户在选择餐厅时, 评分信息并不是唯一
标准, 往往也会被餐厅的位置、装饰或餐厅中某种特定美食所吸引. 可见, Yelp 数据集的数据标签和评分信息不
具有代表性, 这也说明本文模型在数据运用上有所欠缺.
在上面模型的对比实验及对结果的分析中 (详见表 4), 就模型 LG_APIF 的优势以及不足之处均进行了详细
讨论, 可将它的特点整体概括为以下 3 点.
① 在对应用环境的理解方面. 模型 LG_APIF 在 Douban 数据集上, 无论是 Precision, Recall, 还是 NDCG 指标
上都具有明显的优势, 且平均提升 2.43%. 主要原因是由于我们更注重项目分类的方法上, 这一点在同为项目分类
方式较为明显的 Last.fm 和 MovieLens 上得到了验证. 因此, 这也表明了模型 LG_APIF 更适用于处理分类方式具
有明确规则的环境.
② 在对用户的理解方面. 模型 LG_APIF 3 种数据集上的 NDCG 指标上都有着比较明显的优势, 且
平均提升 1.48%, 这说明我们的模型能比较好地适应用户. 用户的整体兴趣能在很大程度上被长期兴趣影响, 同时
由于用户的每一个最近点击也会影响用户的兴趣量, 即模型也能对短期兴趣进行学习, 并试图以此替代长期没有
启动的兴趣.
③ 在对项目的理解方面. 随着迭代次数的增加, 模型 LG_APIF 的性能会在一定区间内保持上升状态, 且在多
次训练后, 模型的预测效果会越来越好. 主要原因是模型中项目的兴趣定位, 均由每个用户的行为密切影响. 随着
模型的成熟 (迭代次数增加), 项目的定位也会变得更为明确, 这也充分说明 LG_APIF 模型设计的有效性.