Page 411 - 《软件学报》2024年第6期
P. 411
钱忠胜 等: 融合自适应周期与兴趣量因子的轻量级 GCN 推荐 2987
24. Output List
End
4 实验设计与对比分析
为验证 LG_APIF 的有效性, 本文选择 4 个数据集进行综合实验对比与分析, 重点回答以下几个问题.
RQ1: 不同超参数对模型效果有何影响?
针对此问题, 在 4.4.1 节设置调参实验, 对超参数在 4 种数据集下的调优过程进行了阐述. 优化模型 LG_APIF
的参数, 并选择了周期间隔数、潜在项目类型数两种关键性参数进行研究, 发现它们与选取的数据集有关, 在不同
的数据集下具有不同的最优值, 且它们所影响的特征与推荐效果具有强相关性.
RQ2: 模型的主要构件有哪些, 以及它们存在的必要性?
针对此问题, 在第 4.4.2 节设置消融实验, 就自适应周期、兴趣量因子及用户-类型-项目三元图结构 3 个主要
构件, 设计了 3 个变体模型分别分析这些构件对模型的作用. 实验结果显示, 这 3 种变体模型的推荐效果均在不同
程度上劣于提出的模型 LG_APIF, 说明这些构件对模型具有重要影响.
RQ3: 与经典的、最新的模型相比, 本文模型的推荐效果如何?
针对此问题, 在第 4.4.3 节设置对比实验, 分别将本文模型与 8 种典型模型就性能方面在 4 种数据集下做对
比, 阐述模型 LG_APIF 的优势. 在其中 3 种数据集上, 本文模型无论是 Precision, Recall, 还是 NDCG 指标都具有
明显优势, 且整体平均提升达 1.53%, 其主要原因是我们的模型比较关注项目的分类方式. 尽管另一个数据集存在
类标签与评分信息不具代表性等问题, 但模型 LG_APIF 还是优于大部分对比模型.
RQ4: 与端到端的模型、推荐框架结构相似的模型相比, 本文模型的效率如何?
针对此问题, 在第 4.4.4 节展开了复杂度分析, 先对本文模型 LG_APIF 的时间复杂度 (即, 各模块时间复杂度
之和) 进行分析, 再与一些端到端的模型, 或推荐框架结构相似的模型在时间复杂度方面做对比, 以评估本文模型
的效率. 经分析得出, 模型 LG_APIF 在时间复杂度上确实有一定的牺牲, 但结合第 4.4.3 节中该模型的较好推荐效
果, 并展开进一步分析, 可知模型 LG_APIF 的设计思想是合理的、有意义的.
RQ5: 模型有哪些地方还可进一步优化? 表 1 数据统计表
针对此问题, 在第 4.4.5 节设置优化实验, 展开 LG_APIF 模型优化前后的对比, 以阐明优化效果. 我们对兴趣
量因子解析过程中的切分指数进行重新定义, 使其由定长改为可随距离当前时刻远近而变化的变长形式, 从而实
现兴趣量因子的自适应性. 通过对比, 优化后的性能得到一定提升, 整体平均提升达 5.04%.
以下实验均在处理器为 AMD Ryzen 7 3700X 8-Core, 内存为 32 GB, 操作系统为 Win 10 64 位, 编程工具为
PyCharm 2021, 编程语言为 Python 3.6 的环境下进行.
4.1 数据集
本文选取的 4 个公开数据集均源于真实业务场景, 它们均为近几年被大量学者使用和研究的经典数据集, 分
别是 Last.fm, Douban, Yelp 以及 MovieLens. 为更好地比较本文模型在各数据集上的表现, 从多角度分析数据集的
特点, 统计结果如表 1 所示.
统计数据 Last.fm Douban Yelp MovieLens
用户数 1 892 129 490 963 923 71 567
项目数 17 632 18 541 2 353 207 10 681
类别数 916 658 72 427
时间区间 1个月 1 000时间标记 5个月 7个月
大小 2 KB 20 MB 100 MB 10 MB