Page 35 - 《软件学报》2020年第12期
P. 35
陈劲松 等:基于多维上下文感知图嵌入模型的兴趣点推荐 3701
describing the user preferences, a more effective user preference formula is designed. Finally, the results of experiments based on the
real-world dataset shows that the proposed model has better recommendation performance.
Key words: mobile recommendation; semantic feature; embedding learning model; topic model
随着通信网络和移动设备的快速发展,基于位置的社交网络方兴未艾,移动用户可以在各种社交平台上分
[1]
享自己的经历,线上虚拟社会和线下物理社会紧密联通,产生海量用户行为数据 .一方面,国家经济的腾飞催生
了大量有价值的兴趣点,如餐馆、商场、超市等,这些项目期望增加客户量,提高商业价值;另一方面,大量兴趣点
的信息对移动用户形成了严重信息负载,造成了移动用户的选择困境.这种需求和供给的矛盾,促使兴趣点
(point-of-interest,简称 POI)推荐逐渐成为推荐系统领域的研究热点之一.
鉴于花费和地理区域的限制,以及隐私保护的需求,多数移动用户仅仅能提供少量签到.这意味着相比于数
字化项目,如音乐和电影,POI 推荐面临更加严峻的数据稀疏性问题.传统多数协同过滤方法的性能,均因用户-
项目矩阵的稀疏而出现明显下降,难以满足移动用户对推荐精度的要求.
根据用户行为特征,我们将签到数量稀疏的移动用户进一步细分为如下几类.
(1) 签到密度较高的移动用户.这类用户虽然整体签到数较少,但是在一段时间内签到较为密集.例如,在
长达 1 年的时间中,用户小张只有 10 次签到,但是这 10 次签到集中在 1 天内或一周内;
(2) 签到密度稀疏的移动用户.这类用户签到数较少,签到记录之间的时间间隔较大.例如,长达 1 年的时
间中,用户小李签到 10 次,这 10 次签到每次间隔 1 个月以上.
通过在一个真实的基于位置的社交网络数据(Yelp)上的分析,我们发现稀疏性签到的用户在所有用户中占
有很大比例(0.829),其中:签到密度较高的稀疏用户占比例 0.504,签到密度较低的稀疏用户占比例 0.326.由此可
知,精准地为这两类稀疏用户实现精准的 POI 推荐,有巨大的经济价值和研究意义.
近期,大量的工作研究如何使用多维信息克服签到数据稀疏性问题,时间、空间、社会化、语义等因素被
引入整体模型,挖掘多元情景对用户偏好的综合影响.文献[2,3]结合时间、空间和语义信息,挖掘用户偏好在这
三维空间内的精准定位.文献[4]对序列因素进行建模,分析符合用户行为序列模型的个人偏好.文献[5]利用时
间因素和空间因素来刻画 POI 特征.文献[6]将时间、空间、语义等引入建模.综上所述,时间、空间和语义因素
是在 POI 推荐算法中常被使用的因素,序列因素则能够有效提升推荐的性能.这是因为签到密度较高的稀疏性
用户占一定比例,序列因素的建模能够有效提升这部分用户的偏好获取.然而我们发现,还没有一种方法能够有
效地为签到密度较低的稀疏用户提供有价值的推荐.
对于签到密度较低的稀疏用户,难以通过建模提取精准的序列效应.受到文献[2]的影响,我们假设用户选择
[7]
POI 和其本身的特征有关,我们首先使用 LDA 主题模型 从用户对 POI 的描述中提取出潜在主题,并且定义了
选择相似度和随机相似度,其中,选择相似度是指同一个用户选择的 POI 间的相似度的平均值,随机相似度是指
用户选择的 POI 和随机抽样的 POI 间的相似度的平均值,如图 1 所示.
从图中可以发现,用户选择的 POI 间有明显的内在相似度.也就是说,用户偏向于选择那些语义相似的 POI.
基于该现象,本文构建了一种图嵌入学习模型,该模型除了统一对时间、地区和描述文字进行统一建模,还
利用潜在的主题模型 LDA 提取用户签到信息的语义信息,并由此定义了 POI-POI 二部图,用以对签到密度较低
的稀疏性用户行为进行建模,以此计算用户偏好.进一步发现,用户的行为存在周期性特征,因此,并非签到时间
越久的行为对本次行为的影响越低,而是用户对越类似的 POI 评分更相近.例如,如果用户还吃辣的食物,那么火
锅类的餐馆评分就会远高于粤菜,这一偏好受到就餐时间的影响较低.考虑到该问题,我们重新定义了用户偏好
公式,以此更加精准刻画移动用户偏好.
本文第 1 节介绍移动推荐领域的相关工作.第 2 节详细介绍基于多维上下文感知图嵌入学习模型.第 3 节
结合该模型设计对比实验,并给出实验结果和相关分析.第 4 节总结全文并展望下一步研究.