Page 324 - 《软件学报》2025年第12期
P. 324

钱忠胜 等: 结合时间间隔数据增强的对偶视图自监督会话推荐模型                                                 5705



                 9. Return  会话推荐列表  List;
                 10. End
                    在算法   3  中, 第  1  行获得数组增强后的会话集      S . 第  2–3  行通过对偶视图编码器获得增强会话          s  的不同会话
                                                                                              a
                                                         a
                                                                                              u
                                                         u
                      a
                                                                            ,
                 嵌入  h ,   f s u  f ,   a  ; 第  4  行通过不同视图间的对比学习获得不同的损失函数  L s1 L s2 ; 第  5  行通过进行推荐任务获得
                      s u   s u
                                                                 ,
                 当前会话的推荐列表        List s u   与损失函数  L rec ; 第  6–7  行结合   L s1 L s2  与   L rec  联合计算损失函数  L, 并更新模型参数;
                 第  8–9  行获取推荐列表   List  并输出.
                  4   实验及其分析
                    为验证   TIDA-DSSR  的有效性, 本文选择 4 个数据集进行综合实验对比分析, 重点回答下面几个问题.
                    RQ1: 与经典的、最新的模型相比, 本文模型的推荐效果如何?
                    针对此问题, 在第     4.4.1  节设置对比实验, 分别将本文模型与         11  种经典模型就性能方面在        4  个数据集下做对
                 比, 阐述本文模型的优势.
                    RQ2: 模型的各个构件是否有存在的必要性?
                    针对此问题, 在第     4.4.2  节设置消融实验, 就基于时间信息的数据增强模块、超图卷积模块、原始会话对比学
                 习模块这   3  个主要构件分别分析其对总体模型的作用.
                    RQ3: 本文模型的主要构件用到其他模型中是否有效?
                    针对此问题, 在第     4.4.3  节设置构件组合合理性实验, 分析本文模型的主要构件用于其他不同对比模型中对这
                 些模型性能的影响, 以阐明所提模型的构件组合是合理的.
                    RQ4: 主要的超参数对于模型效果有何影响?
                    针对此问题, 在第     4.4.4  节设置参数敏感度实验, 分析主要超参数在不同数据集下对模型性能的影响, 以进一
                 步优化模型.
                    RQ5: 模型的时间复杂度如何?
                    针对此问题, 在第     4.4.5  节设置模型复杂度分析, 计算本文模型的时间复杂度, 并于主流模型比较, 阐述本文模
                 型复杂度情况.
                    RQ6: 模型框架的扩展性如何?
                    针对此问题, 在第     4.4.6  节设置模型框架分析, 就对比学习框架在复杂的、多样化的推荐场景时的扩展性进行
                 了详细探讨.
                  4.1   数据集与环境设置
                    本文选取的     4  个公开数据集均来自于真实业务场景, 分别是             Beauty, Sports, Home, Yelp. 这  4  个数据集覆盖了
                 各种用户需求和偏好, 例如美食、美容、运动和家居等. 这意味着推荐系统可针对不同用户提供更具个性化的推
                 荐. 它们均为近几年被大量学者使用和研究的经典数据集, 统计结果如表                      2  所示.


                                                      表 2 数据集信息

                               统计数据            Beauty       Sports        Home         Yelp
                               用户数             22 363       35 598       66 370        19 855
                               项目数             12 101       18 357       28 237        14 541
                               交互次数           198 502       296 337      551 682      207 045
                              稀疏性 (%)          99.92        99.95         99.97        99.92
                             平均会话长度            8.87          8.32         8.29         10.42

                    1) Beauty (https://github.com/KingGugu/TiCoSeRec/tree/main/data): 化妆品购买数据. 其收集了某化妆品购物网
                 站的真实用户行为日志, 记录了用户的浏览、加购、订单等行为序列, 以及网站商品的相关信息.
   319   320   321   322   323   324   325   326   327   328   329