Page 330 - 《软件学报》2025年第12期

P. 330

钱忠胜等: 结合时间间隔数据增强的对偶视图自监督会话推荐模型 5711

DSSR 性能提升明显, HR 与 NDCG 指标分别平均提升 34.5% 和 17.6%. 其中, 在 HR 指标上, 至少提升 20.1%, 最
多提升可达 49.2%. 与 Ours-4 相比, Ours-2 和 Ours-3 变体模型效果均得到提升. 由此可知, 数据增强模块与其他构
件组合对于本文模型性能具有促进作用.
5) 从仅保留对偶视图编码器构件的变体模型来看, 对偶视图编码构件与其他构件的组合是有效的 (变体模型
Ours-5). 本文模型 TIDA-DSSR 使用对偶视图编码器分别从会话内和会话间建模, 这需提供不同信息的会话序列
和融合不同角度的信息, 而基于时间间隔的数据增强模块与自监督任务学习模块可较好地完成上述任务. 由表 6
可看出, 与 Ours-5 变体模型相比, 所提模型 TIDA-DSSR 性能提升明显, HR 与 NDCG 指标分别平均提升 32.2%
和 17.3%. 其中, 在 HR 指标上, 至少提升 20.3%, 最多提升可达 57.7%. 与 Ours-5 相比, Ours-1 和 Ours-3 变体模型
效果均得到改善. 由此可知, 对偶视图编码器与其他构件的组合对于本文模型性能具有积极作用.
综上分析可知: ① 与仅采用原始会话相比, 经过时间间隔数据增强后的会话充分利用了会话的侧信息, 使得
会话嵌入的信息更加丰富, 可更准确地捕捉用户兴趣. ② 利用超图卷积网络编码器提取不同会话间的信息, 再与
Transformer 编码器形成对偶视图对会话序列编码, 使会话嵌入所含信息更加全面. ③ 加入原始会话信息组成多角
度的自监督任务, 可有效地缓解模型训练早期数据增强带来的无关项目干扰问题, 提升模型的泛化能力. ④ 时间
间隔数据增强构件、对偶视图编码构件与其他构件的组合是合理的, 对于本文模型性能的提升具有非常重要的
作用.
4.4.3 构件组合合理性实验 (RQ3)
为验证本文模型中的其中 2 个核心构件 (时间间隔数据增强、对偶视图编码) 的合理性及其独立应用的效果,
本节设计了一组实验, 将这 2 个构件分别加入或替换至 DHCN 与 CoSeRec 这两个经典的对比模型中, 分析各构件
给对比模型性能带来的影响, 以评估它们在其他系统中的适用性和通用性. 注意, 因对比模型中信息通道不同, 它
们的对比学习框架存在较大差异, 与所提模型的对比学习框架不可兼容, 故在此不讨论替换对比学习框架的情况.
在数据集选择方面, 由于 Sports 数据集在本文所使用的 4 个数据集中特征分布最为均衡, 具有较高的普适性, 因此
实验基于 Sports 数据集展开. 在评价指标上, 选取 HR@20 和 NDCG@20 (分别简记为 HR 和 NDCG) 作为主要衡
量标准, 用以综合评估推荐结果的准确性与排序质量. 实验结果展示了各构件单独应用于对比模型后对模型性能
的改变情况, 如表 7 所示. 通过对比分析, 判断这些构件是否能够在不同模型中独立发挥作用, 并进一步验证其在
提升推荐任务性能方面的有效性.

表 7 构件组合合理性实验结果对比

时间间隔数据增强对偶视图编码
对比项 DHCN CoSeRec DHCN CoSeRec
HR NDCG HR NDCG HR NDCG HR NDCG
原对比模型指标 0.053 2 0.026 4 0.062 9 0.029 2 0.053 2 0.026 4 0.062 9 0.029 2
加入/替换后指标 0.051 7 0.025 6 0.065 2 0.031 6 0.050 3 0.024 7 0.060 2 0.027 1
与原对比模型比较 (%) 2.82↓ 3.03↓ 3.66↑ 8.22↑ 5.45↓ 6.44↓ 4.29↓ 7.19↓
本模型指标 0.082 2 0.037 3 0.082 2 0.037 3 0.082 2 0.037 3 0.082 2 0.037 3
与本模型比较 (%) 58.99↓ 45.70↓ 26.07↓ 18.04↓ 63.42↓ 51.01↓ 36.54↓ 37.64↓

在引入时间间隔数据增强构件后, 不同模型的表现差异显著. 对于 DHCN 模型, HR 指标下降了 2.82%, NDCG
指标下降了 3.03%. 这主要是由于 DHCN 模型中的超图节点卷积网络和超边卷积网络在时间间隔数据增强的
基础上链接了更多的邻居节点. 然而, 过多的邻居节点信息会稀释目标会话嵌入对自身信息的表达能力, 导致难以
精准捕捉用户意图, 从而引发性能下降. 相比之下, 对于 CoSeRec 模型, HR 和 NDCG 指标分别提升了 3.66% 和
8.22%, 展现了一定的性能改进. 这表明 CoSeRec 模型的框架设计更能有效地利用时间间隔数据增强所带来的信
息, 提升推荐质量. 即便如此, 与本文提出的 TIDA-DSSR 模型相比, 其性能仍存在较大的差距, 在 HR 和 NDCG 指
标上分别相差 26.07% 和 18.04%.
在替换对偶视图编码构件后, 不同模型的性能同样受到显著影响. 对于 DHCN 模型, HR 和 NDCG 指标分别

325 326 327 328 329 330 331 332 333 334 335