Page 315 - 《软件学报》2025年第12期
P. 315
5696 软件学报 2025 年第 36 卷第 12 期
Transformer encoder to capture the hidden high-order relationships between sessions from multiple perspectives, thus enhancing the
diversity of recommendations. Finally, the model integrates the augmented intra-session information, the multi-viewed inter-session
information, and the original session information for contrastive learning to strengthen the model’s generalization ability. Comparisons with
11 existing classic models on 4 datasets show that the proposed model is feasible and efficient, with average improvements of 5.96% and
5.89% on HR and NDCG metrics, respectively.
Key words: session-based recommendation; self-supervised learning; hypergraph convolutional network; dual-view; data augmentation
1 引 言
随着电子商务的快速发展, 消费者的购物行为逐渐呈现出高频短时、目标明确的特征. 在此背景下, 会话推荐
系统 (session-based recommender system, SBRS) 通过精准捕捉用户短期行为, 提供即时个性化推荐, 成为电商平台
提升用户体验和转化率的关键. SBRS 的核心在于充分挖掘用户行为数据, 从会话内和会话间两个维度分析, 全面
捕捉用户的兴趣模式. 会话内分析聚焦于单个会话中用户的行为序列, 挖掘目标导向和时序特征, 从而预测短期兴
趣并提供即时推荐; 而会话间分析则侧重于跨会话的潜在高阶关系, 揭示用户或商品间的隐式关联, 发现更广泛的
需求模式. 两者的协同建模不仅强化了系统的实时性与泛化性, 还能平衡短期行为预测与全局兴趣刻画, 显著提升
推荐效果, 为用户和平台创造更多价值.
早期的 SBRS 研究 [1] 主要关注于在会话内分析用户与项目的交互数据预测用户短期兴趣. 尽管这些早期技术
在当时取得初步成功, 但往往对复杂用户行为建模能力不足. 随着机器学习尤其是深度学习技术的飞速发展, 诸如
[3]
[2]
基于循环神经网络 (recurrent neural network, RNN) 或图神经网络 (graph neural network, GNN) 的序列化推荐模
型, 被广泛应用于捕捉会话中的兴趣偏好. 此外, 在捕获序列中的复杂依赖关系方面, 基于 Transformer 等更多先进
技术的模型已被证明表现较出色. 然而, 这些模型所利用的时间信息过于单调, 未合理处理用户交互项目间长短不
一的时间间隔信息, 从而影响模型预测的准确性.
除会话内的信息外, 会话间的高阶关系近来也被研究人员发现会显著影响推荐结果. 而图卷积网络 (graph
convolutional network, GCN) 因其强大的关系提取能力被应用于建模会话间的高阶关系. 其中, 超图卷积网络
(hypergraph convolution network, HGCN) [4–7] 常被研究人员用于建模会话间关系, 但其仅从超图节点的角度建模, 考
虑的角度比较单一. Xia 等人 [8] 根据超图节点与超边的联系对项目与会话的关系进行建模, 并融入自监督学习最大
化节点与超边的互信息. 但对于图上的高阶邻居信息的提取程度不够, 使得会话嵌入的多样性不足. 特别地, 用户
在会话中通常会表现多样化的兴趣. 单一地依赖行为序列往往仅能反映显式偏好, 而结合隐藏的高阶关系 (如相似
用户的行为模式) 可揭示更深层次的偏好. 在实际应用场景中, 用户的行为模式常受到多种因素的影响 (如上下文、
时间、场景等), 隐藏的高阶关系能综合会话内外的信息进行全局建模, 为复杂场景下的个性化推荐提供有力支撑.
例 1: 用户 A 购买了吸尘器、电视机、洗碗机、燃气灶, 用户 B 购买了投影仪、扫地机器人、烤箱、燃气灶.
对于这两个会话, 除了最后一项购买的商品相同外, 没有相同的商品, 一般的会话推荐系统并不会把这两个会话联
系起来. 但是, 这两个会话中有相似的商品且最后购买的商品是一样的, 我们认为这是会话中的隐藏高阶关系.
近年来, 研究人员将数据增强 (data augmentation) 与对比学习 (contrastive learning) [9–11] 引入推荐领域, 缓解了
数据稀疏性问题, 同时也有效地融合会话内与会话间信息. 然而, 现有方法多依赖简单的随机采样或启发式策略生
成正负样本, 可能会导致关键会话信息的丢失, 尤其在会话推荐系统中更为显著. 对于会话内和会话间的特征建
模, 传统对比学习方法的局限性尤为突出. 就会话内而言, 简单的数据增强策略无法有效捕捉行为序列中的时序依
赖和短期兴趣变化, 从而影响推荐的即时性和准确性. 而就会话间而言, 需更精细建模用户间的复杂高阶关系. 现
有的对比学习结构通常单一, 仅能捕获局部信息, 难以揭示会话间潜在的全局上下文关联, 这限制了模型对跨会话
关系的提取. 此外, 单一尺度的对比学习框架难以适应多样化的用户行为模式和复杂场景中的动态需求. 因此, 进
一步结合数据增强与对比学习, 通过整合会话内的时序信息和会话间的高阶关联, 可全面地提取用户兴趣特征, 提
升模型的泛化能力和推荐性能, 为复杂推荐任务提供更具鲁棒性和适应性的解决方案.
通过以上分析, 我们发现基于数据增强的会话推荐系统存在以下问题.

