Page 415 - 《软件学报》2024年第6期
P. 415
钱忠胜 等: 融合自适应周期与兴趣量因子的轻量级 GCN 推荐 2991
由上可知, 模型 LG_APIF 在不同数据集下性能最优时, CTN 的取值差异很大, 因为每个数据集的项目分类方
式, 以及项目类型数和个体数的占比均不一致, 且各用户在不同领域中表现出的偏好方式也有所区别. 因此, 我们
在 Last.fm, Douban, Yelp 及 MovieLens 中, 对 CTN 的最优取值分别为 40, 35, 15 和 25.
综合以上两个重要参数的调优实验, 旨在选取能使模型 LG_APIF 达到最优推荐效果的参数. 此外, 不难看出
TPN 和 CTN 均直接影响着兴趣量因子等特征的求解和用户-类型-项目三元图结构的构建, 这些均足以表明本文
重点挖掘的深度信息确实深刻地影响着推荐效果.
4.4.2 不同模型构件消融实验分析
由前面可知, 模型 LG_APIF 的关键是求解自适应周期和兴趣量因子, 即分别为 3.1.2 节遗忘曲线规律的公式 (2)
中两个重要参数 t 和 φ , 利用公式 (2) 求出用户感兴趣的项目类型, 来进一步构建用户-类型-项目三元图结构, 最终
通过轻量级 GCN 的高阶传播, 求出用户或项目的最终嵌入表示, 即用户对项目的最终得分.
显然, 自适应周期、兴趣量因子及用户-类型-项目三元图结构是模型 LG_APIF 的 3 个主要构件, 为验证它们
的必要性, 构建 3 种变体模型 LG_XIF、LG_APX 及 X_APIF 与本文的 LG_APIF 进行消融实验对比. 表 3 是几种
变体模型的影响因素对比情况 (其中, “×”表示该构件被替换; “○”表示该构件未被替换).
Last.fm
表 3 各模型构件影响对比
变体模型 自适应周期 兴趣量因子 三元图结构
LG_XIF × ○ ○
LG_APX ○ × ○
X_APIF ○ ○ ×
LG_APIF ○ ○ ○
但与传统消融实验不同的是, 这些变体模型并不是去掉原模型的某些构件, 而是进行构件替换. 比如, 本文的
自适应周期是历史兴趣在此次推荐时刻与其在未来将会被遗忘的时刻 (该时刻与推荐时刻无关) 之差, 而在大多
数模型中直接被认为就是两次推荐时刻之差, 所以变体模型 LG_XIF 中的自适应周期求解部分采用两次推荐的时
刻差进行替换; 变体模型 LG_APX 的兴趣量因子解析部分采用大多数模型一样的方式进行替换, 即通过用户的评
分或浏览次数直接求解兴趣量; 变体模型 X_APIF 则是将传统的用户-项目交互图替换成用户-类型交互图, 求得目
标兴趣项目类型后, 再通过协同过滤的方式确定类型中的目标项目.
在 Last.fm, Douban, Yelp 及 MovieLens 这 4 个公开数据集上实验, 考虑到变体模型的目的是验证模型
LG_APIF 中各关键构件对推荐性能的影响, 这里仅选择准确率 (Precision) 指标进行评估, 如图 9 所示.
LG_XIF LG_APX X_APIF LG_APIF
0.35
0.30
0.25
Precision 0.20
0.15
0.10
0.05
0
Douban Yelp MovieLens
图 9 各变体模型与 LG_APIF 的 Precision 对比
从图 9 可看出, 用户-类型-项目三元图构件的影响最为明显, 变体模型 X_APIF 基于用户-类型交互图, 先预测
潜在项目类型, 再进行个体预测, 显然其效果远低于模型 LG_APIF. 另外, 替换自适应周期为两次推荐时刻差的变
体模型 LG_XIF 的推荐准确率也远低于模型 LG_APIF. 此外, 采用评分或浏览次数来计算兴趣量的变体模型
LG_APX 的推荐性能也逊色于模型 LG_APIF.
1) 用户-类型-项目三元图构件对推荐性能的影响最大. 替换三元图构件的变体模型 X_APIF 虽然也遵从本文