Page 39 - 《软件学报》2020年第12期
P. 39
陈劲松 等:基于多维上下文感知图嵌入模型的兴趣点推荐 3705
POI-时间段图用于刻画 POI 和访问时间之间的关联,根据文献[18],用户的行为存在时间周期性.也就是说,
在不同的时间段内,用户趋向于访问不同类型的 POI.为此,我们分析了 Yelp 数据集,从中抽取了多个项目,并将
其在时间轴上的签到频数作图,获得图 4.
Fig.3 Distance offset between adjacent POIs
图 3 相邻 POI 之间的距离偏移量
Fig.4 Visits at different times
图 4 不同时间段内的访问量
由图 4 所示,每个 POI 都存在不同的周期.例如,1 号 POI 是一所医院,由于医院通常工作日上班,因此,工作
日就诊的用户较多.也就是说,一些功能性的 POI,如银行、医院等,有明显的时间周期,在不同时间段的访问人数
有显著变化.目前,为了刻画时间周期性,通常会将签到时间划分成不同的时间段:一种是按照工作时间划分,将
其划分为工作日和周末;一种是按照不同时间粒度划分,如月、日、小时.
在构建 POI-时间段图时,根据图 4 所显示的统计结果,我们按照一周 7 天的规则对时间进行划分.并依据
POI 被签到的时间,为其匹配对应的时间段,并将这种周期性关系保存于 POI-时间段图中.
2.3 图嵌入模型
给定一个二部图 G VV =(V A ∪V B ),V A 和 V B 是两个互不相交的顶点集.依据文献[23,26]中提出的方法,我们可以
使用负采样的方式计算图中每个顶点在潜空间中的嵌入向量:
O = argmax ∑ w ⋅ ij log ( p v v i (1)
| )
j
ij e ∈ ε
K
) +
log (pv | )v = log (vσ T v ⋅ i ∑ E [log ( v vσ − ⋅ )] (2)
j i j n v ~ n P v ( ) n i
n= 1
目标函数如公式(1)所示,其训练的目标是为了让二部图中一个端点被选择时,另一边与之关联端点出现的
概率即条件概率达到最大.v i 和 v j 是边 e ij 的两个端点,其中,v i 属于 V A ,v j 属于 V B ,v n 是通过负采样从 V B 得到的顶