Page 413 - 《软件学报》2024年第6期
P. 413
钱忠胜 等: 融合自适应周期与兴趣量因子的轻量级 GCN 推荐 2989
从各方面将提出的模型 LG_APIF 与上述模型展开对比分析, 并据此来验证模型 LG_APIF 的有效性. 为更直观地
阐明本文模型与对比模型的联系与区别, 对各模型进行整体比较, 如表 2 所示.
表 2 各模型特征对比
模型 基础信息 深度信息 方法复杂度
BPR ☆☆☆☆☆ ☆☆☆☆☆ ☆☆☆☆☆
DiffNet++ ★☆☆☆☆ ☆☆☆☆☆ ★☆☆☆☆
DHCF ★☆☆☆☆ ☆☆☆☆☆ ★☆☆☆☆
DeepFM ★☆☆☆☆ ★☆☆☆☆ ★☆☆☆☆
LightGCN ★★☆☆☆ ☆☆☆☆☆ ★★☆☆☆
2
S -MHCN ★★★☆☆ ★☆☆☆☆ ★★★☆☆
SEPT ★★★★☆ ★★☆☆☆ ★★★☆☆
FAWMF ★★★★☆ ★★☆☆☆ ★★★☆☆
LG_APIF ★★★★★ ★★★★★ ★☆☆☆☆
Recall 值均达到最大, NDCG
注: 采用五星打分制表示信息利用程度或方法复杂程度的深浅, “★”数量越多表示程度越深
4.4 实验结果分析
下面结合各节的实验或分析验证本文模型的有效性. 其中, 在第 4.4.1 节对模型的 2 种关键参数进行调优操
作, 以回答 RQ1; 在第 4.4.2 节针对本文模型的 3 大构件设计了 3 种变体模型, 将这些模型与本文模型进行消融实
验对比分析, 以回答 RQ2; 在第 4.4.3 节将本文模型与 7 种经典的、最新的相关模型做对比实验, 通过对比结果,
详细分析并阐明本文模型的有效性及其优势, 以回答 RQ3; 在第 4.4.4 节对本文模型与相关对比模型做复杂度对
比与分析, 阐明了本文模型的效率及依存的优势, 以回答 RQ4; 在第 4.4.5 节对本模型在设计上的不足进行补充,
通过模型优化前后的对比结果, 来阐述模型优化的效果及可行性, 以回答 RQ5.
4.4.1 模型参数调优
在 4 种不同主题的典型数据集 (Last.fm, Douban, Yelp 及 MovieLens) 上进行实验, 删除了用户与项目类型的
交互次数均小于 50 的用户, 以及不足 10 个项目的项目类型数据. 将各数据集的 70% 作为训练集, 30% 作为测试
集, 且进一步将训练集和测试集分别按照时间节点以 7:3 的比例划分为模型训练数据和真实标签数据. 超参数分
别包括周期间隔数 (Time_Period_Num, TPN)、潜在项目类型数 (CAT_Top_N, CTN).
1) 周期间隔数 TPN
TPN 是用户兴趣变化周期间隔大小的因素, 代表用户的浏览历史时间间隔的切分块数. TPN 过大会导致单位
时间间隔过小, 造成数据稀疏性加大, 兴趣变化幅度过于敏感; 而 TPN 过小会导致单位时间间隔过大, 则会丢失某
些重要时刻的兴趣变化. 因此, TPN 在很大程度上决定用户整体的兴趣变化趋势. 实验中, TPN 的值设置为{1, 3, 5,
7, 9, 11, 13, 15, 17, 19, 21, 23, 25}, 其各指标随 TPN 的变化情况如图 7 所示.
由图 7 可知, 随着 TPN 增大, 模型 LG_APIF 在不同数据集下的表现有较明显差异: 在 Last.fm 中, TPN 取
3 时, 各项指标都处于最大值; 在 Douban 中, 比较 3 个评价指标的变化趋势, TPN 的最优值分布在区间 [15, 19], 其
中 TPN 取 15 时, Precision 和 值还有一些上升, 但不明显; 在 Yelp 中, TPN 取 7 时,
Recall 达到最大值, 且 Precision 和 NDCG 值尽管不是最大, 但和最大值相差甚小; 在 MovieLens 中, TPN 取 11 时,
NDCG 达到明显的峰值, Precision 和 Recall 值在区间 [9, 13] 波动不大.
由上可知, 模型 LG_APIF 在不同数据集下性能最优时, TPN 的取值均不一样, 我们认为这是合理的, 因为每
个数据集的时间周期跨度均不一致, 只有当切分周期的周长设置合理时, 模型的性能才可达到最优. 因此, 我们在
Last.fm, Douban, Yelp 及 MovieLens 中, 对 TPN 的最优取值分别为 3, 15, 7 和 11.
2) 潜在项目类型数 CTN
CTN 是兴趣类型分布范围的关键因素, 它代表需要确定用户的潜在兴趣类型数量, CTN 过大会导致推荐的关