Page 35 - 《软件学报》2020年第12期
P. 35

陈劲松  等:基于多维上下文感知图嵌入模型的兴趣点推荐                                                      3701


         describing the user preferences, a  more effective user preference formula is designed. Finally, the results of experiments based on the
         real-world dataset shows that the proposed model has better recommendation performance.
         Key words:    mobile recommendation; semantic feature; embedding learning model; topic model

             随着通信网络和移动设备的快速发展,基于位置的社交网络方兴未艾,移动用户可以在各种社交平台上分
                                                                        [1]
         享自己的经历,线上虚拟社会和线下物理社会紧密联通,产生海量用户行为数据 .一方面,国家经济的腾飞催生
         了大量有价值的兴趣点,如餐馆、商场、超市等,这些项目期望增加客户量,提高商业价值;另一方面,大量兴趣点
         的信息对移动用户形成了严重信息负载,造成了移动用户的选择困境.这种需求和供给的矛盾,促使兴趣点
         (point-of-interest,简称 POI)推荐逐渐成为推荐系统领域的研究热点之一.
             鉴于花费和地理区域的限制,以及隐私保护的需求,多数移动用户仅仅能提供少量签到.这意味着相比于数
         字化项目,如音乐和电影,POI 推荐面临更加严峻的数据稀疏性问题.传统多数协同过滤方法的性能,均因用户-
         项目矩阵的稀疏而出现明显下降,难以满足移动用户对推荐精度的要求.
             根据用户行为特征,我们将签到数量稀疏的移动用户进一步细分为如下几类.
             (1)  签到密度较高的移动用户.这类用户虽然整体签到数较少,但是在一段时间内签到较为密集.例如,在
                 长达 1 年的时间中,用户小张只有 10 次签到,但是这 10 次签到集中在 1 天内或一周内;
             (2)  签到密度稀疏的移动用户.这类用户签到数较少,签到记录之间的时间间隔较大.例如,长达 1 年的时
                 间中,用户小李签到 10 次,这 10 次签到每次间隔 1 个月以上.
             通过在一个真实的基于位置的社交网络数据(Yelp)上的分析,我们发现稀疏性签到的用户在所有用户中占
         有很大比例(0.829),其中:签到密度较高的稀疏用户占比例 0.504,签到密度较低的稀疏用户占比例 0.326.由此可
         知,精准地为这两类稀疏用户实现精准的 POI 推荐,有巨大的经济价值和研究意义.
             近期,大量的工作研究如何使用多维信息克服签到数据稀疏性问题,时间、空间、社会化、语义等因素被
         引入整体模型,挖掘多元情景对用户偏好的综合影响.文献[2,3]结合时间、空间和语义信息,挖掘用户偏好在这
         三维空间内的精准定位.文献[4]对序列因素进行建模,分析符合用户行为序列模型的个人偏好.文献[5]利用时
         间因素和空间因素来刻画 POI 特征.文献[6]将时间、空间、语义等引入建模.综上所述,时间、空间和语义因素
         是在 POI 推荐算法中常被使用的因素,序列因素则能够有效提升推荐的性能.这是因为签到密度较高的稀疏性
         用户占一定比例,序列因素的建模能够有效提升这部分用户的偏好获取.然而我们发现,还没有一种方法能够有
         效地为签到密度较低的稀疏用户提供有价值的推荐.
             对于签到密度较低的稀疏用户,难以通过建模提取精准的序列效应.受到文献[2]的影响,我们假设用户选择
                                                     [7]
         POI 和其本身的特征有关,我们首先使用 LDA 主题模型 从用户对 POI 的描述中提取出潜在主题,并且定义了
         选择相似度和随机相似度,其中,选择相似度是指同一个用户选择的 POI 间的相似度的平均值,随机相似度是指
         用户选择的 POI 和随机抽样的 POI 间的相似度的平均值,如图 1 所示.
             从图中可以发现,用户选择的 POI 间有明显的内在相似度.也就是说,用户偏向于选择那些语义相似的 POI.
             基于该现象,本文构建了一种图嵌入学习模型,该模型除了统一对时间、地区和描述文字进行统一建模,还
         利用潜在的主题模型 LDA 提取用户签到信息的语义信息,并由此定义了 POI-POI 二部图,用以对签到密度较低
         的稀疏性用户行为进行建模,以此计算用户偏好.进一步发现,用户的行为存在周期性特征,因此,并非签到时间
         越久的行为对本次行为的影响越低,而是用户对越类似的 POI 评分更相近.例如,如果用户还吃辣的食物,那么火
         锅类的餐馆评分就会远高于粤菜,这一偏好受到就餐时间的影响较低.考虑到该问题,我们重新定义了用户偏好
         公式,以此更加精准刻画移动用户偏好.
             本文第 1 节介绍移动推荐领域的相关工作.第 2 节详细介绍基于多维上下文感知图嵌入学习模型.第 3 节
         结合该模型设计对比实验,并给出实验结果和相关分析.第 4 节总结全文并展望下一步研究.
   30   31   32   33   34   35   36   37   38   39   40