Page 401 - 《软件学报》2024年第6期
P. 401
钱忠胜 等: 融合自适应周期与兴趣量因子的轻量级 GCN 推荐 2977
线性回归方法, 拟合出同种项目类型在不同兴趣形态下的兴趣函数, 最后根据目标用户对该项目类型的当前兴趣
形态, 匹配兴趣函数以预测下一个行为的自适应周期.
3) 解析兴趣量因子. 重组行为记忆序列, 对时间进行切块, 构建用户-项目兴趣浮点模型, 生成项目兴趣指数,
将该指数输入到变换后的 Sigmoid 函数, 计算各个兴趣类型的项目兴趣量.
4) 生成推荐列表. 通过兴趣模型计算用户的项目类型兴趣占比, 结合用户兴趣项目类型建立用户-类型-项目
三元图结构, 利用 GCN 技术传播每个嵌入层, 最终以用户和项目的最后一层嵌入向量内积作为用户对项目的得
分, 经排序后, 输出项目个体推荐列表.
用户偏好特征 项目类型推荐列表
用户兴趣
形态聚类
C 1 C 2 …
C N
兴趣函数
数据过滤 数据预处理 基础表生成 拟合
兴趣周期聚类
自适应
行为记忆序列 周期
(b) 自适应周期预测
行为记忆序列转化
兴趣量因子
100 自适应周期 时间周期切块 兴趣浮点模型
80
60
40 Sigmoid 优化
(1)
(2) (3)
e n e n e n e i (3) e i (2) e i (1)
20
0
1 2 3 4 5 6 7 C 1 … C n φ 1 φ 2 φ 3 … φ N e n (0) e i (0)
兴趣模型 行为记忆序列重组 兴趣量因子 预测值
(a) 兴趣模型建构 (c) 兴趣量因子解析 (d) GCN 推荐结果生产
图 1 融合深度信息的轻量级 GCN 推荐模型整体框架
3.1 兴趣模型构建 节);
本节将介绍如何把历史序列转换成行为记忆的形式, 以及如何在兴趣模型的构建中, 计算用户兴趣程度.
3.1.1 行为记忆
为表达各用户的兴趣规律, 先定义模型中每个用户的数据表示形式. 用户与项目的交互时序信息对于用户未
来的行为倾向具有很大影响. 因此, 如果用 T i (i ∈ [1, n), n 为交互的总次数) 表示相邻行为时刻的间隔, 即目标项目
对同一项目类型第 i 次和第 i+1 次浏览的时间间隔, 那么用户 u 在一个周期内对项目类型 i 产生的行为集可表示
为 {T 1 ,T 2 ,T 3 ,...,T n−1 } . 进一步地, 将用户一个周期的行为记录拓展为行为记忆的表示形式:
i
B = {T 1 ,T 2 ,T 3 ,...,T n−1 ,τ,T p },
u
其中, 深度信息 T p (p 标记该变量为预测变量) 表示预测用户下一次行为与最近一次行为的时间间隔, 最主要的特
点是其不仅受自身历史行为的影响, 还受其他用户对该项目的历史行为影响, 导致其会随着整体行为规律的变化
而改变, 因此, 将其定义为自适应周期 (详见第 3.2 τ 表示最近一次对该项目行为的时间戳.
因此, 用户在一个周期内的行为记忆可理解为用户浏览或者购买项目的行为规律. 据此, 通过用户的一个行为
记忆来预测下一次浏览该项目的时间点, 正是推荐模型需要关注的要点.
3.1.2 兴趣程度
由行为记忆的定义可知, 行为记忆的丰富与否并不能直观地体现出用户的兴趣关联, 但在构建兴趣模型, 以及
量化用户兴趣程度时, 往往可体现其独特的优势. 在推荐中, 用户兴趣一般可分为长期兴趣和短期兴趣, 但这两种
兴趣在一个较短的浏览周期内的表现形式是相似的, 导致长短期兴趣难以区分. 因此, 在用户兴趣变化过程中, 能
使长期兴趣保留下来, 同时继续挖掘用户的潜在兴趣, 是保证推荐效果的关键. 显然, 这种思想十分符合艾宾浩斯
遗忘曲线的规律.