Page 325 - 《软件学报》2025年第12期
P. 325

5706                                                      软件学报  2025  年第  36  卷第  12  期


                    2) Sports (https://github.com/KingGugu/TiCoSeRec/tree/main/data): 体育用品购买数据. 其包含某体育用品在线
                 购物网站的用户点击流和交易数据, 并记录了用户浏览网站、点击商品以及订单的时间序列.
                    3) Home (https://github.com/KingGugu/TiCoSeRec/tree/main/data): 家居购物数据. 其记录了用户在家居商品网
                 站的浏览、点赞、加购、订单等交互行为序列.
                    4) Yelp (https://www.yelp.com/dataset): 餐厅点评数据. 数据标签包括用户对商家的评论及评分等.
                    所提模型    TIDA-DSSR  采用  PyTorch  框架, Windows 10 64  位操作系统, PyCharm 2022, Python 3.7, torch
                 1.11.0, numpy 1.20.1, 内存  64 GB, CPU  为  12th Gen Intel(R) Core(TM) i7-12650H 2.30 GHz, GPU  为  NVIDIA
                 GeForce RTX 4060. 参照文献  [19], 本文模型的嵌入向量维度设置为        128, 训练批次大小为     512, 学习率为  0.001, 使
                 用  Adam  作为优化器优化模型, 最大序列长度设置为             50, Softmax  温度值为  1.0, 权重衰减参数为   1E–6, epoch  为
                 300, 并采取早期停止策略, 即若连续        150  个周期内验证数据集上的 HR@20 和 NDCG@20 指标未增加, 则提前终
                 止训练.
                  4.2   评价指标
                    在评估会话推荐系统性能时, 我们采用             HR (hit ratio) 和  NDCG (normalized discounted cumulative gain) 作为主
                 要评价指标. HR    的选取源于其直观反映推荐准确性的能力, 直接衡量用户感兴趣的项目是否被成功推荐. 而
                 NDCG  则因其综合考虑了推荐列表中项目的排序质量和用户兴趣度, 通过折损方式强调高排名的相关项目, 更能
                 体现推荐系统的综合性能. 这两个指标能反映对推荐系统效能的全面评价.
                    1) HR, 命中率, 主要强调模型推荐的准确性, 如公式           (14) 所示:

                                                           M
                                                      HR =   ×100%                                   (14)
                                                           N
                 其中, M  为推荐任务命中的项目数, N        为推荐任务给出的总项目数.
                    2) NDCG, 归一化折损累计增益, 是一种衡量推荐结果质量的关键指标, 如公式                    (15) 所示:

                                                      ∑     1  ∑ K  2 t i −1
                                               NDCG =                                                (15)
                                                                i=1 log 2 (i−1)
                                                         u∈U test Y u
                 其中,  U test  为测试用户集;  Y u  为用户  u 的最大 NDCG 值;  K  为已推荐项目数;  t i = 1 表示击中,  t i = 0 表示未击中.
                  4.3   对比模型
                                                                                            [8]
                                                                                                      [9]
                    下面将所提模型       TIDA-DSSR  与相关模型    LightGCN [32] , STAMP [33] , BERT4Rec  [34] , DHCN , CL4SRec ,
                                                        4
                 CoSeRec [18] , DuoRec [16] , TiCoSeRec [19] , SSDRec [23] , S Rec [35] , SparseEnNet [36] 做对比实验, 阐明本文模型的优势. 这几
                 种作为对比的深度模型采用了不同方法, 包括基于图神经网络的方法、基于强化学习的方法、基于自注意力机制
                 的序列建模方法、基于自监督学习的方法等.
                    1) LightGCN: 为  GCN  推荐方面的代表性方法之一, 主要特点是移除了             GCN  中的特征变换和聚合函数组件,
                 使设计更简单、高效.
                    2) STAMP: 是将用户短期与长期兴趣融为一体的注意力机制运用于推荐系统的典型实例, 能根据用户的短期
                 与长期兴趣相似性生成个性化的推荐.
                    3) BERT4Rec: 是将  BERT  运用于推荐系统的开创性研究, 通过使用双向编码器来建模用户行为序列中的上
                 下文信息和长期依赖关系.
                    4) DHCN: 一种基于深度学习的会话推荐模型, 它利用动态超图结构来捕捉用户与项目之间的复杂关系, 并结
                 合自监督学习提高推荐效果.
                    5) CL4SRec: 一种基于强化学习的会话推荐框架, 在会话中持续强化模型以建模用户动态的短期兴趣和漂移
                 的长期偏好.
                    6) CoSeRec: 一种融合序列和语义信息的会话推荐模型, 通过协同学习同时建模用户的历史行为序列和项目
                 内容的语义特征.
                    7) DuoRec: 一种双塔结构的推荐模型, 通过用户塔和项目塔分别学习用户和项目的低维表示, 并基于两者的
   320   321   322   323   324   325   326   327   328   329   330