Page 331 - 《软件学报》2025年第12期
P. 331
5712 软件学报 2025 年第 36 卷第 12 期
下降了 5.45% 和 6.44%. 这是因为对偶视图编码构件的替换导致 DHCN 模型无法充分利用超边卷积网络所提取
的会话间信息, 从而使会话嵌入缺乏多样性, 进而影响推荐效果. 在 CoSeRec 模型中, 替换对偶视图编码构件后,
HR 和 NDCG 指标分别下降了 4.29% 和 7.19%. 其原因在于, CoSeRec 模型的数据增强策略未根据对偶视图编码
构件的特点进行有针对性的调整. 例如, CoSeRec 中的 Reorder 操作会改变用户会话中项目的顺序, 这种改动可能
在卷积过程中引入过多无关的邻居节点, 干扰会话间信息的提取, 从而对推荐结果造成负面影响.
综上所述, 本文提出的 TIDA-DSSR 模型突出了时间间隔数据增强、对偶视图编码以及多视角对比学习框架
在推荐中互相协同. 时间间隔数据增强通过捕捉用户行为的时间动态特征, 为模型提供了更丰富的信息表达; 对偶
视图编码通过整合会话间的信息, 显著提升了嵌入的多样性和精度; 而多视角对比学习框架则进一步优化了模型
的泛化能力. 这 3 个核心构件的相互结合, 实现了推荐性能提升的最大化. 然而, 为确保这些构件在不同模型和场
景中的兼容性和有效性, 所提模型进行了精细的设计和调整, 从而使其能在复杂推荐任务中充分发挥作用.
4.4.4 参数敏感度实验 (RQ4)
本文模型 TIDA-DSSR 包含 3 大模块, 在时间间隔数据增强模块中, 均匀会话占比 (记为 σ) 是该模块的关键
参数; 在对偶视图编码模块中, 超图卷积网络层数 (记为 θ) 是对该模块影响最大的参数; 在自监督学习任务模块
中, 超图卷积权重 (记为 λ 1 ) 和原始会话对比学习权重 (记为 λ 2 ) 是最关键的 2 个参数. 故本节通过实验分析这 4 个
参数对模型性能的影响. 选取 HR@10 和 NDCG@10 (简记为 HR 和 NDCG) 作为评价指标.
σ 的影响
1) 均匀会话占比
σ 是决定均匀会话在全体会话中占比的参数, 体现会话数据增强的范围大小. σ 过大意味着会话中均匀会话
占比较大, 则需数据增强的会话占比就少, 从而缩小数据增强的作用范围; σ 过小意味着需数据增强的会话占比较
多, 使得较为完整的会话也会进行数据增强, 很难体现用户的真实偏好. σ 的值从集合{0, 0.1, 0.2, 0.3, 0.4, 0.5}中选
取, 各指标值随 σ 的变化情况如图 2 所示.
HR@10 NDCG@10 HR@10 NDCG@10
0.086 4 0.046 8 0.056 0.031
0.084 0 0.055
0.045 6 0.030
HR 值 0.081 6 0.044 4 NDCG 值 HR 值 0.054 0.029 NDCG 值
0.079 2
0.076 8 0.053
0.043 2 0.052 0.028
0.074 4
0.072 0 0.042 0 0.051 0.027
0.0 0.1 0.2 0.3 0.4 0.5 0.0 0.1 0.2 0.3 0.4 0.5
均匀会话占比 ( ) σ 均匀会话占比 ( ) σ
(a) 在 Beauty 上的实验效果 (b) 在 Sports 上的实验效果
HR@10 NDCG@10 HR@10 NDCG@10
0.029 0.016 2 0.067 0 0.038 5
0.028 0.066 5
0.015 4 0.038 0
HR 值 0.027 0.014 6 NDCG 值 HR 值 0.066 0 0.037 5 NDCG 值
0.026
0.025 0.065 5
0.013 8 0.037 0
0.024 0.065 0
0.023 0.013 0 0.064 5 0.036 5
0.0 0.1 0.2 0.3 0.4 0.5 0.0 0.1 0.2 0.3 0.4 0.5
均匀会话占比 ( ) σ 均匀会话占比 ( ) σ
(c) 在 Home 上的实验效果 (d) 在 Yelp 上的实验效果
σ 的影响
图 2 参数
从图 2 中可看出, 随着 σ 的增大, 模型的性能先上升后下降. 当 σ 值为 0.2 时, 模型在 Beauty、Sports 以及
Home 数据集上的性能达到最优. 而在 Yelp 数据集上, 当 σ 值为 0.3 时, 模型性能为最优. 推荐效果先增后减的这

