Page 413 - 《软件学报》2024年第6期
P. 413

钱忠胜 等: 融合自适应周期与兴趣量因子的轻量级               GCN  推荐                                  2989


                 从各方面将提出的模型        LG_APIF  与上述模型展开对比分析, 并据此来验证模型              LG_APIF  的有效性. 为更直观地
                 阐明本文模型与对比模型的联系与区别, 对各模型进行整体比较, 如表                     2  所示.

                                                    表 2    各模型特征对比

                          模型                  基础信息                  深度信息                 方法复杂度
                          BPR                ☆☆☆☆☆                 ☆☆☆☆☆                 ☆☆☆☆☆
                        DiffNet++            ★☆☆☆☆                 ☆☆☆☆☆                 ★☆☆☆☆
                         DHCF                ★☆☆☆☆                 ☆☆☆☆☆                 ★☆☆☆☆
                        DeepFM               ★☆☆☆☆                 ★☆☆☆☆                 ★☆☆☆☆
                        LightGCN             ★★☆☆☆                 ☆☆☆☆☆                 ★★☆☆☆
                         2
                        S -MHCN              ★★★☆☆                 ★☆☆☆☆                 ★★★☆☆
                         SEPT                ★★★★☆                 ★★☆☆☆                 ★★★☆☆
                        FAWMF                ★★★★☆                 ★★☆☆☆                 ★★★☆☆
                        LG_APIF              ★★★★★                 ★★★★★                 ★☆☆☆☆
                                        Recall 值均达到最大, NDCG
                 注: 采用五星打分制表示信息利用程度或方法复杂程度的深浅, “★”数量越多表示程度越深

                  4.4   实验结果分析
                    下面结合各节的实验或分析验证本文模型的有效性. 其中, 在第                     4.4.1  节对模型的  2  种关键参数进行调优操
                 作, 以回答  RQ1; 在第  4.4.2  节针对本文模型的    3  大构件设计了    3  种变体模型, 将这些模型与本文模型进行消融实
                 验对比分析, 以回答      RQ2; 在第  4.4.3  节将本文模型与   7  种经典的、最新的相关模型做对比实验, 通过对比结果,
                 详细分析并阐明本文模型的有效性及其优势, 以回答                 RQ3; 在第  4.4.4  节对本文模型与相关对比模型做复杂度对
                 比与分析, 阐明了本文模型的效率及依存的优势, 以回答                 RQ4; 在第  4.4.5  节对本模型在设计上的不足进行补充,
                 通过模型优化前后的对比结果, 来阐述模型优化的效果及可行性, 以回答                      RQ5.
                  4.4.1    模型参数调优
                    在  4  种不同主题的典型数据集       (Last.fm, Douban, Yelp  及  MovieLens) 上进行实验, 删除了用户与项目类型的
                 交互次数均小于      50  的用户, 以及不足   10  个项目的项目类型数据. 将各数据集的           70%  作为训练集, 30%   作为测试
                 集, 且进一步将训练集和测试集分别按照时间节点以                 7:3  的比例划分为模型训练数据和真实标签数据. 超参数分
                 别包括周期间隔数       (Time_Period_Num, TPN)、潜在项目类型数    (CAT_Top_N, CTN).
                    1) 周期间隔数    TPN
                    TPN  是用户兴趣变化周期间隔大小的因素, 代表用户的浏览历史时间间隔的切分块数. TPN                          过大会导致单位
                 时间间隔过小, 造成数据稀疏性加大, 兴趣变化幅度过于敏感; 而                  TPN  过小会导致单位时间间隔过大, 则会丢失某
                 些重要时刻的兴趣变化. 因此, TPN        在很大程度上决定用户整体的兴趣变化趋势. 实验中, TPN                的值设置为{1, 3, 5,
                 7, 9, 11, 13, 15, 17, 19, 21, 23, 25}, 其各指标随  TPN  的变化情况如图  7  所示.
                    由图   7  可知, 随着  TPN  增大, 模型  LG_APIF  在不同数据集下的表现有较明显差异: 在            Last.fm  中, TPN  取
                 3  时, 各项指标都处于最大值; 在      Douban  中, 比较  3  个评价指标的变化趋势, TPN    的最优值分布在区间        [15, 19], 其
                 中  TPN  取  15  时, Precision  和                值还有一些上升, 但不明显; 在        Yelp  中, TPN  取  7  时,
                 Recall 达到最大值, 且  Precision  和  NDCG  值尽管不是最大, 但和最大值相差甚小; 在       MovieLens 中, TPN  取  11  时,
                 NDCG  达到明显的峰值, Precision  和  Recall 值在区间  [9, 13] 波动不大.
                    由上可知, 模型     LG_APIF  在不同数据集下性能最优时, TPN         的取值均不一样, 我们认为这是合理的, 因为每
                 个数据集的时间周期跨度均不一致, 只有当切分周期的周长设置合理时, 模型的性能才可达到最优. 因此, 我们在
                 Last.fm, Douban, Yelp  及  MovieLens 中, 对  TPN  的最优取值分别为  3, 15, 7  和  11.
                    2) 潜在项目类型数     CTN
                    CTN  是兴趣类型分布范围的关键因素, 它代表需要确定用户的潜在兴趣类型数量, CTN                        过大会导致推荐的关
   408   409   410   411   412   413   414   415   416   417   418