Page 45 - 《软件学报》2020年第12期
P. 45

陈劲松  等:基于多维上下文感知图嵌入模型的兴趣点推荐                                                      3711















                       Fig.7    Precision rate and recall rate under different dimensions on Foursquare
                             图 7   在 Foursquare 数据集上不同维度下的精确率和召回率

             从实验结果中可以看出:在不同的 Top_N 的推荐下,模型的推荐性能并没有随着空间向量维度的增加而不
         断不提高.在 Yelp 数据集上的实验结果显示:当空间向量维度 d 的取值在 50~80 之间时,模型所计算得到的精确
         率与召回率随着 d 的增大而不断增加;当维度 d 的取值在 80~110 之间时,这种增长模式却呈现出一种相反的态
         势——精确率与召回率随着 d 的增大而不断减小;在 Foursquare 数据集上也有着相同的波动趋势,且当维度 d
         取值为 90 时,能得到最优的实验效果.但在维度设置较小时,所得到的实验结果较差,这与在 Yelp 数据集上得到
         的实验结果不同.这种实验结果在一定程度上说明:空间向量的表示能力会随着维度的增加而不断变大,但同
         时,空间向量的表示能力具有一定的不稳定性,即维度过大或者过小都将对空间向量的表示能力造成消极影响.
         并且空间向量维度的增大会导致另外一个问题——收敛变慢,训练模型的耗时增加.由于在训练过程中,为了尽
         可能降低时间损耗,我们采用的训练方法为设置固定的迭代次数,即当模型训练的迭代次数固定时,若向量维度
         过大,在迭代过程中图节点的结构并没有完全达到稳定的状态,则训练出来的空间向量表示能力将会变弱.所
         以,综合时间损耗和推荐性能这两个方面的考虑,我们将空间向量维度 d 的值设置为 80.
             至此,模型的参数调整实验告一段落,后续的模块中,将会使用上述所确定的参数值进行相关实验.
         3.4.2    模型对比
             在得到一组最优的参数设定之后,接下来我们将 MCAGE 模型与包括 JIM,GE,GeoMF,RankGeoFM 以及
         TAD-FPMC 在内的 5 种推荐模型在两个数据集上作比较,并使用精确率和召回率来评价模型的推荐性能.具体
         的实验结果如图 8、图 9 所示.
             从整体的实验结果上来看,我们所提出的 MCAGE 模型的推荐性能都要优于其他 5 种模型.因为在 MCAGE
         模型中不仅考虑到了地理因素、时间因素和语义因素,还通过诸如评分等信息来捕捉用户的动态偏好特征,所
         以在实验中能表现出较好的推荐性能,并且该实验结果还能说明:在引入多因素建模方面,图嵌入模型是一种高
         效的选择.JIM 模型的推荐性能位列第 2,这是因为在 JIM 模型中也融入了包括语义因素、地理因素以及口碑因
         素等,不但充分挖掘了 POI 的语义信息,还将其与 POI 的地理特征联合建模.但是在 JIM 模型中并没有考虑到用
         户个性化特征的计算,由于忽略了此点,它在推荐的表现不及 MCAGE 模型.TAD-FPMC 模型的效果位列第 3,虽
         然在该模型中引入了 POI 的分类数据,通过对用户签到记录之间的 POI 分类转移进行建模来为用户推荐,但由
         于数据集中存在大量的签到稀疏用户,使用这种方法对用户行为进行建模会受到较大的影响.GE 模型的效果次
         于 MCAGE,JIM 和 TAD-FPMC,虽然 GE 也是使用的图嵌入模型,但在 GE 中,图模型构建的核心是 POI 间的序
         列效应,而在数据集中,用户签到记录的时间跨度很大,不同用户签到记录的密度也有很大的差距,这些因素对
         需要利用序列效应来构建二部图的 GE 模型造成了较大的挑战.并且在 GE 模型中,计算用户偏好特征时使用的
         是一种基于时间延迟的方法,而依据我们收集统计的 Yelp 数据集中的评分数据,用户最近的签到记录并不能够
         准确地刻画用户的偏好特征,甚至在有些情况下,这些签到记录所体现出的偏好特征会与用户的真实偏好间呈
         现出一种相对立的状况.所以受到这两种因素的制约,GE 模型的推荐性能比起 MCAGE,JIM 和 TAD-FPMC 就逊
         色了很多.GeoMF 模型与 RankGeoFM 模型较为相似,二者都是融入了地理因素,但 RankGeoFM 采用了基于排
         名的因子分解,虽然二者在处理手法上有很多相似之处,但加上了基于排名的 RankGeoFM 模型在最终的推荐结
   40   41   42   43   44   45   46   47   48   49   50