Page 324 - 《软件学报》2025年第12期
P. 324
钱忠胜 等: 结合时间间隔数据增强的对偶视图自监督会话推荐模型 5705
9. Return 会话推荐列表 List;
10. End
在算法 3 中, 第 1 行获得数组增强后的会话集 S . 第 2–3 行通过对偶视图编码器获得增强会话 s 的不同会话
a
a
u
u
a
,
嵌入 h , f s u f , a ; 第 4 行通过不同视图间的对比学习获得不同的损失函数 L s1 L s2 ; 第 5 行通过进行推荐任务获得
s u s u
,
当前会话的推荐列表 List s u 与损失函数 L rec ; 第 6–7 行结合 L s1 L s2 与 L rec 联合计算损失函数 L, 并更新模型参数;
第 8–9 行获取推荐列表 List 并输出.
4 实验及其分析
为验证 TIDA-DSSR 的有效性, 本文选择 4 个数据集进行综合实验对比分析, 重点回答下面几个问题.
RQ1: 与经典的、最新的模型相比, 本文模型的推荐效果如何?
针对此问题, 在第 4.4.1 节设置对比实验, 分别将本文模型与 11 种经典模型就性能方面在 4 个数据集下做对
比, 阐述本文模型的优势.
RQ2: 模型的各个构件是否有存在的必要性?
针对此问题, 在第 4.4.2 节设置消融实验, 就基于时间信息的数据增强模块、超图卷积模块、原始会话对比学
习模块这 3 个主要构件分别分析其对总体模型的作用.
RQ3: 本文模型的主要构件用到其他模型中是否有效?
针对此问题, 在第 4.4.3 节设置构件组合合理性实验, 分析本文模型的主要构件用于其他不同对比模型中对这
些模型性能的影响, 以阐明所提模型的构件组合是合理的.
RQ4: 主要的超参数对于模型效果有何影响?
针对此问题, 在第 4.4.4 节设置参数敏感度实验, 分析主要超参数在不同数据集下对模型性能的影响, 以进一
步优化模型.
RQ5: 模型的时间复杂度如何?
针对此问题, 在第 4.4.5 节设置模型复杂度分析, 计算本文模型的时间复杂度, 并于主流模型比较, 阐述本文模
型复杂度情况.
RQ6: 模型框架的扩展性如何?
针对此问题, 在第 4.4.6 节设置模型框架分析, 就对比学习框架在复杂的、多样化的推荐场景时的扩展性进行
了详细探讨.
4.1 数据集与环境设置
本文选取的 4 个公开数据集均来自于真实业务场景, 分别是 Beauty, Sports, Home, Yelp. 这 4 个数据集覆盖了
各种用户需求和偏好, 例如美食、美容、运动和家居等. 这意味着推荐系统可针对不同用户提供更具个性化的推
荐. 它们均为近几年被大量学者使用和研究的经典数据集, 统计结果如表 2 所示.
表 2 数据集信息
统计数据 Beauty Sports Home Yelp
用户数 22 363 35 598 66 370 19 855
项目数 12 101 18 357 28 237 14 541
交互次数 198 502 296 337 551 682 207 045
稀疏性 (%) 99.92 99.95 99.97 99.92
平均会话长度 8.87 8.32 8.29 10.42
1) Beauty (https://github.com/KingGugu/TiCoSeRec/tree/main/data): 化妆品购买数据. 其收集了某化妆品购物网
站的真实用户行为日志, 记录了用户的浏览、加购、订单等行为序列, 以及网站商品的相关信息.

