Page 411 - 《软件学报》2024年第6期
P. 411

钱忠胜 等: 融合自适应周期与兴趣量因子的轻量级               GCN  推荐                                  2987



                 24. Output List
                 End

                  4   实验设计与对比分析

                    为验证   LG_APIF  的有效性, 本文选择     4  个数据集进行综合实验对比与分析, 重点回答以下几个问题.
                    RQ1: 不同超参数对模型效果有何影响?
                    针对此问题, 在     4.4.1  节设置调参实验, 对超参数在      4  种数据集下的调优过程进行了阐述. 优化模型             LG_APIF
                 的参数, 并选择了周期间隔数、潜在项目类型数两种关键性参数进行研究, 发现它们与选取的数据集有关, 在不同
                 的数据集下具有不同的最优值, 且它们所影响的特征与推荐效果具有强相关性.
                    RQ2: 模型的主要构件有哪些, 以及它们存在的必要性?
                    针对此问题, 在第     4.4.2  节设置消融实验, 就自适应周期、兴趣量因子及用户-类型-项目三元图结构                     3  个主要
                 构件, 设计了   3  个变体模型分别分析这些构件对模型的作用. 实验结果显示, 这                  3  种变体模型的推荐效果均在不同
                 程度上劣于提出的模型        LG_APIF, 说明这些构件对模型具有重要影响.
                    RQ3: 与经典的、最新的模型相比, 本文模型的推荐效果如何?
                    针对此问题, 在第      4.4.3  节设置对比实验, 分别将本文模型与         8  种典型模型就性能方面在        4  种数据集下做对
                 比, 阐述模型   LG_APIF  的优势. 在其中   3  种数据集上, 本文模型无论是        Precision, Recall, 还是  NDCG  指标都具有
                 明显优势, 且整体平均提升达         1.53%, 其主要原因是我们的模型比较关注项目的分类方式. 尽管另一个数据集存在
                 类标签与评分信息不具代表性等问题, 但模型              LG_APIF  还是优于大部分对比模型.
                    RQ4: 与端到端的模型、推荐框架结构相似的模型相比, 本文模型的效率如何?
                    针对此问题, 在第     4.4.4  节展开了复杂度分析, 先对本文模型         LG_APIF  的时间复杂度    (即, 各模块时间复杂度
                 之和) 进行分析, 再与一些端到端的模型, 或推荐框架结构相似的模型在时间复杂度方面做对比, 以评估本文模型
                 的效率. 经分析得出, 模型      LG_APIF  在时间复杂度上确实有一定的牺牲, 但结合第             4.4.3  节中该模型的较好推荐效
                 果, 并展开进一步分析, 可知模型        LG_APIF  的设计思想是合理的、有意义的.
                    RQ5: 模型有哪些地方还可进一步优化?              表 1    数据统计表
                    针对此问题, 在第     4.4.5  节设置优化实验, 展开    LG_APIF  模型优化前后的对比, 以阐明优化效果. 我们对兴趣
                 量因子解析过程中的切分指数进行重新定义, 使其由定长改为可随距离当前时刻远近而变化的变长形式, 从而实
                 现兴趣量因子的自适应性. 通过对比, 优化后的性能得到一定提升, 整体平均提升达                        5.04%.
                    以下实验均在处理器为         AMD Ryzen 7 3700X 8-Core, 内存为  32 GB, 操作系统为  Win 10 64  位, 编程工具为
                 PyCharm 2021, 编程语言为  Python 3.6  的环境下进行.
                  4.1   数据集
                    本文选取的     4  个公开数据集均源于真实业务场景, 它们均为近几年被大量学者使用和研究的经典数据集, 分
                 别是  Last.fm, Douban, Yelp  以及  MovieLens. 为更好地比较本文模型在各数据集上的表现, 从多角度分析数据集的
                 特点, 统计结果如表      1  所示.


                             统计数据          Last.fm       Douban          Yelp        MovieLens
                              用户数           1 892        129 490        963 923       71 567
                              项目数          17 632         18 541        2 353 207     10 681
                              类别数           916            658            72           427
                             时间区间          1个月         1 000时间标记         5个月          7个月
                               大小           2 KB          20 MB         100 MB        10 MB
   406   407   408   409   410   411   412   413   414   415   416