Page 318 - 《软件学报》2025年第12期
P. 318

钱忠胜 等: 结合时间间隔数据增强的对偶视图自监督会话推荐模型                                                 5699



                         原始会话序列                  Transformer 编码器
                                                                                 对比学习    L s1
                                                  Multi-head         原始会话嵌入
                                     ×n             attention  Add & norm  Feed forward  Add & norm  线性
                                                                                               加权
                                                                            推荐
                                                                                                    L
                                                                                        L rec
                                                                                     ···
                      时间间隔                                           增强会话嵌入
                      数据增强                                             (会话内)
                                                                                 推荐列表
                         d  d  d  d  d
                                                                                         L s2
                                                                                 对比学习
                                     ×n
                                                                     增强会话嵌入
                       间隔均匀的会话序列                    超图编码器              (会话间)
                   (a) 实施数据增强丰富会话内信息        (b) 构建对偶视图捕捉会话间信息                (c) 运用对比学习优化推荐
                                    图 1 结合时间间隔数据增强的对偶视图自监督会话推荐框架

                    1) 利用时间间隔信息实施数据增强, 以丰富会话内信息. 统计用户会话序列中项目间的时间间隔信息并计算
                 出方差, 以此为依据对不同会话进行不同方式的数据增强, 使会话成为时间间隔均匀的会话序列, 充分挖掘会话内
                 的侧信息.
                    2) 构建对偶视图进行编码, 以捕捉会话间信息. 考虑用户会话内以及相似会话间的关系, 利用超图卷积网络编
                 码器与   Transformer 编码器组成的对偶视图编码器, 从两种不同视角分别对原始会话以及间隔均匀的会话进行编
                 码, 以提取不同视角下会话的多样性信息.
                    3) 运用对比学习优化模型, 并生成推荐列表. 将原始会话与时间间隔数据增强后的会话输入对偶视图编码器
                 得到不同视角下的会话嵌入, 以数据增强后的会话嵌入                  (会话内) 作为主体生成推荐列表, 用其他视角下的会话嵌
                 入  (原始会话、会话间) 作为对比信号加入自监督学习, 以优化模型.

                  3.1   实施数据增强丰富会话内信息
                    数据增强一直是生成对比学习所需自监督信号的重要手段. 有效的数据增强策略不仅可针对性地生成对比学
                 习信号, 也能挖掘会话内的侧信息, 使会话嵌入信息更丰富, 从而提高推荐准确性. TiCoSeRec                       [19] 首次将会话内项
                 目间的时间间隔时长信息融入数据增强策略中, 将原始会话增强为时间间隔均匀的会话, 并充分证明了其能有效
                 地提升推荐效果. 本研究受此文启发, 从会话内项目间的时间间隔时长信息入手对数据增强的                                4  种方法  (即  Ti-
                 Insert 操作、Ti-Crop  操作、Ti-Mask  操作、Ti-Substitute 操作) 实施改进. 我们在  TiCoSeRec 模型的基础上有针对
                 性地调整与改良, 以提升其在匿名会话推荐场景中的适应性与泛化能力. 首先, 在                        Ti-Insert 操作中, 引入基于统计
                 分布的动态插入比, 同时结合项目间的相似度, 确保插入项目符合上下文环境并增补潜在的语义信息. 其次, 针对
                 Ti-Crop  操作, 通过动态调整裁剪比, 限制对短会话的干扰, 保持核心行为序列的完整性, 同时增强生成后数据的多
                 样性. 此外, 在  Ti-Mask  操作中, 基于时间间隔和语义相关性引入优先级筛选机制, 精准选择需屏蔽的项目, 避免随
                 机屏蔽破坏上下文信息的完整性, 同时保留关键信息以辅助模型学习. 而在                       Ti-Substitute 操作中, 不仅考虑项目间
                 的相似性, 而且还结合上下文语义的一致性, 确保替换项目既丰富了语义信息又保持会话的整体逻辑. 通过这些改
                 进方法, 进一步提升了增强数据的质量和多样性, 为匿名会话推荐任务提供了更加高效的、鲁棒性更强的解决
                 方案.
                    在数据增强过程中, 本研究避免了使用             Reorder 操作, 因为模型的超图卷积编码器需要依赖用户会话中项目
                 顺序来识别不同会话间的隐性关联. Reorder 操作可能会破坏会话中项目顺序, 导致模型在卷积过程中错误地连接
                 无关的邻居节点, 从而影响高阶隐藏关系的提取. 排除                Reorder 操作有助于保持数据集的真实性和一致性, 减少对
                 原始数据结构的破坏, 更准确地捕捉用户行为的时序特征, 避免信息丢失和噪声增加. 用户浏览习惯的时序规律对
   313   314   315   316   317   318   319   320   321   322   323