Page 402 - 《软件学报》2024年第6期
P. 402
2978 软件学报 2024 年第 35 卷第 6 期
下面引入艾宾浩斯遗忘曲线来模拟用户的兴趣变化过程, 包括解析行为记忆以构建兴趣模型, 以及求解兴趣
程度的方式. 艾宾浩斯遗忘曲线如图 2 所示.
100
记忆保持率 (%) 60 记忆量
80
40
20
0
时间
图 2 艾宾浩斯遗忘曲线
艾宾浩斯遗忘曲线最显著的特点就是在每一个时间点上, 均有其对应的记忆保持率, 其中有一种记忆保持率
函数 j 表示被相关学者 [22] 充分运用, 如公式 (1) 所示:
20e b
j = (1)
(λt +t 0 ) c
α 和浏览周期
其中, t 是两次相邻记忆时刻的时间差, t 0 =0.00255, e 为自然数底, b 和 c 均为常数, 为使艾宾浩斯遗忘曲线更好地
模拟兴趣变化过程, 将时间轴放大 λ 倍.
例 1: 以项目 A 为例, 用 φ A 表示对 A 的兴趣量. 结合用户的记忆行为, 取第 1 次浏览结束的时间点作为时间
原点, 计算第 1 次与第 2 次浏览间的时间差 t. 将 t 带入记忆保持率函数, 得到第 2 次开始浏览的记忆保持率 j A . 然
后将 j A 与之前得到的 φ A (浏览信息 A 最近 1 次表现出的兴趣量) 相乘, 得到第 2 次浏览时推荐项目 A 的兴趣程
度 f A . 之后的第 2 次推荐, 可取第 2 次浏览结束后的时刻作为新的时间点. 若用户在下一次浏览中继续浏览同一类
φ A 以新一次浏览结束时刻作为新
信息, 则说明他的兴趣未改变. 为体现用户未改变兴趣, 将新浏览得到的兴趣量
时间点来计算记忆保持率, 记为 j A , 以进一步确定对项目 A 的兴趣程度.
通过例 1, 就可预测出用户下次浏览该类信息的兴趣程度 f, 从而挖掘出用户的潜在兴趣. 如公式 (2) 所示:
20e b
f = j×φ = ×φ (2)
(λt +t 0 ) c
由公式 (2) 可知, 用户对信息相邻两次浏览间的时间差 t 及兴趣量 φ 是影响兴趣程度的两个关键因素. 在进行
推荐时, 时间差 t 应能随着当前浏览周期的兴趣分布特性自动生成, 从而预测用户下一次可能会再次关注该兴趣
的时刻; 兴趣量则可看成是当前浏览周期结束后对该兴趣的兴趣剩余量. 其中, 该时间差即为行为记忆序列中的自
适应周期 T p ; 一段浏览周期结束后, 用户对目标兴趣的兴趣剩余量称为兴趣量因子 φ .
显然, 上述这两个参数均是用户与项目基础信息中无法轻易得到的, 而需经过一系列对基础信息的归纳和转
化, 因此, 我们将这类信息称为深度信息. 接下来, 第 3.2 节主要求解自适应周期; 第 3.3 节主要求解兴趣量因子. 结
合这两个特征, 便可清晰地表示出用户的兴趣分布特性, 从而作出更为准确的推荐.
3.2 自适应周期生成
β 可很好地分别描述行为记忆的深度和广度, 但简单地将用户
通过研究发现, 用户的浏览频数
历史记录中总的浏览频数和浏览周期解析出的兴趣表现, 只是用户对项目的整体兴趣程度. 事实上, 用户历史记录
中, 哪怕是对同一个项目, 在不同时间段都可能会表现多种不同兴趣. 因此, 将整体兴趣表现来标识近期的兴趣程
度, 将会丢失大量重要信息.
为更形象地描述用户对项目在不同周期内的兴趣表现, 这里定义兴趣形态, 以区别于兴趣程度. 其中, 兴趣程
度仅发生在某一时间跨度, 某一时刻兴趣的唯一独立的兴趣表现; 兴趣形态则不局限于某一时间跨度, 可在同一时
刻表示多种兴趣表现的共现情况, 即兴趣形态可指任一时间跨度, 任一维度下的一种兴趣表现.
例 2: 在图 3 中, 第 i 个浏览周期内的第 j 个浏览时刻点用 t i 表示, 其中 t 1j , t 2j , t 3 与 j t 4j (0 ⩽ j ⩽ 3) 均表示同一
j
用户对目标项目的不同历史浏览周期或不同用户对目标项目的同一浏览周期, 则 t i0 , t i1 , t i 与 2 t i3 (1 ⩽ i ⩽ 4) 表示对