Page 39 - 《软件学报》2020年第12期
P. 39

陈劲松  等:基于多维上下文感知图嵌入模型的兴趣点推荐                                                      3705


             POI-时间段图用于刻画 POI 和访问时间之间的关联,根据文献[18],用户的行为存在时间周期性.也就是说,
         在不同的时间段内,用户趋向于访问不同类型的 POI.为此,我们分析了 Yelp 数据集,从中抽取了多个项目,并将
         其在时间轴上的签到频数作图,获得图 4.

















                                    Fig.3    Distance offset between adjacent POIs
                                       图 3   相邻 POI 之间的距离偏移量
















                                         Fig.4    Visits at different times
                                         图 4   不同时间段内的访问量

             由图 4 所示,每个 POI 都存在不同的周期.例如,1 号 POI 是一所医院,由于医院通常工作日上班,因此,工作
         日就诊的用户较多.也就是说,一些功能性的 POI,如银行、医院等,有明显的时间周期,在不同时间段的访问人数
         有显著变化.目前,为了刻画时间周期性,通常会将签到时间划分成不同的时间段:一种是按照工作时间划分,将
         其划分为工作日和周末;一种是按照不同时间粒度划分,如月、日、小时.
             在构建 POI-时间段图时,根据图 4 所显示的统计结果,我们按照一周 7 天的规则对时间进行划分.并依据
         POI 被签到的时间,为其匹配对应的时间段,并将这种周期性关系保存于 POI-时间段图中.
         2.3   图嵌入模型
             给定一个二部图 G VV =(V A ∪V B ),V A 和 V B 是两个互不相交的顶点集.依据文献[23,26]中提出的方法,我们可以
         使用负采样的方式计算图中每个顶点在潜空间中的嵌入向量:
                                        O =  argmax ∑  w ⋅  ij  log ( p v v i                 (1)
                                                             | )
                                                            j
                                                  ij e ∈ ε
                                                      K
                                                   ) +
                                log (pv  | )v =  log (vσ  T    v ⋅     i ∑  E  [log ( v vσ  −     ⋅     )]  (2)
                                     j  i       j        n v  ~ n P v ( )  n  i
                                                     n= 1
             目标函数如公式(1)所示,其训练的目标是为了让二部图中一个端点被选择时,另一边与之关联端点出现的
         概率即条件概率达到最大.v i 和 v j 是边 e ij 的两个端点,其中,v i 属于 V A ,v j 属于 V B ,v n 是通过负采样从 V B 得到的顶
   34   35   36   37   38   39   40   41   42   43   44