Page 318 - 《软件学报》2025年第12期
P. 318
钱忠胜 等: 结合时间间隔数据增强的对偶视图自监督会话推荐模型 5699
原始会话序列 Transformer 编码器
对比学习 L s1
Multi-head 原始会话嵌入
×n attention Add & norm Feed forward Add & norm 线性
加权
推荐
L
L rec
···
时间间隔 增强会话嵌入
数据增强 (会话内)
推荐列表
d d d d d
L s2
对比学习
×n
增强会话嵌入
间隔均匀的会话序列 超图编码器 (会话间)
(a) 实施数据增强丰富会话内信息 (b) 构建对偶视图捕捉会话间信息 (c) 运用对比学习优化推荐
图 1 结合时间间隔数据增强的对偶视图自监督会话推荐框架
1) 利用时间间隔信息实施数据增强, 以丰富会话内信息. 统计用户会话序列中项目间的时间间隔信息并计算
出方差, 以此为依据对不同会话进行不同方式的数据增强, 使会话成为时间间隔均匀的会话序列, 充分挖掘会话内
的侧信息.
2) 构建对偶视图进行编码, 以捕捉会话间信息. 考虑用户会话内以及相似会话间的关系, 利用超图卷积网络编
码器与 Transformer 编码器组成的对偶视图编码器, 从两种不同视角分别对原始会话以及间隔均匀的会话进行编
码, 以提取不同视角下会话的多样性信息.
3) 运用对比学习优化模型, 并生成推荐列表. 将原始会话与时间间隔数据增强后的会话输入对偶视图编码器
得到不同视角下的会话嵌入, 以数据增强后的会话嵌入 (会话内) 作为主体生成推荐列表, 用其他视角下的会话嵌
入 (原始会话、会话间) 作为对比信号加入自监督学习, 以优化模型.
3.1 实施数据增强丰富会话内信息
数据增强一直是生成对比学习所需自监督信号的重要手段. 有效的数据增强策略不仅可针对性地生成对比学
习信号, 也能挖掘会话内的侧信息, 使会话嵌入信息更丰富, 从而提高推荐准确性. TiCoSeRec [19] 首次将会话内项
目间的时间间隔时长信息融入数据增强策略中, 将原始会话增强为时间间隔均匀的会话, 并充分证明了其能有效
地提升推荐效果. 本研究受此文启发, 从会话内项目间的时间间隔时长信息入手对数据增强的 4 种方法 (即 Ti-
Insert 操作、Ti-Crop 操作、Ti-Mask 操作、Ti-Substitute 操作) 实施改进. 我们在 TiCoSeRec 模型的基础上有针对
性地调整与改良, 以提升其在匿名会话推荐场景中的适应性与泛化能力. 首先, 在 Ti-Insert 操作中, 引入基于统计
分布的动态插入比, 同时结合项目间的相似度, 确保插入项目符合上下文环境并增补潜在的语义信息. 其次, 针对
Ti-Crop 操作, 通过动态调整裁剪比, 限制对短会话的干扰, 保持核心行为序列的完整性, 同时增强生成后数据的多
样性. 此外, 在 Ti-Mask 操作中, 基于时间间隔和语义相关性引入优先级筛选机制, 精准选择需屏蔽的项目, 避免随
机屏蔽破坏上下文信息的完整性, 同时保留关键信息以辅助模型学习. 而在 Ti-Substitute 操作中, 不仅考虑项目间
的相似性, 而且还结合上下文语义的一致性, 确保替换项目既丰富了语义信息又保持会话的整体逻辑. 通过这些改
进方法, 进一步提升了增强数据的质量和多样性, 为匿名会话推荐任务提供了更加高效的、鲁棒性更强的解决
方案.
在数据增强过程中, 本研究避免了使用 Reorder 操作, 因为模型的超图卷积编码器需要依赖用户会话中项目
顺序来识别不同会话间的隐性关联. Reorder 操作可能会破坏会话中项目顺序, 导致模型在卷积过程中错误地连接
无关的邻居节点, 从而影响高阶隐藏关系的提取. 排除 Reorder 操作有助于保持数据集的真实性和一致性, 减少对
原始数据结构的破坏, 更准确地捕捉用户行为的时序特征, 避免信息丢失和噪声增加. 用户浏览习惯的时序规律对

