Page 47 - 《软件学报》2020年第12期
P. 47
陈劲松 等:基于多维上下文感知图嵌入模型的兴趣点推荐 3713
5 个单词中包括了诸如展品、博物馆等词汇,在一定程度上能够反映出 POI393 的类别特征;在 POI1888 的主题
特征分布中,主题 29 和主题 33 都占有较高的比例,查找这两个主题中的高频词可知,都是表现的餐饮行业的特
征,如主题 29 中的“星巴克”一词,就具有很高的区分度;POI2772 的主题特征分布比较有特点,主题 3 占据了很高
的比例,而该主题中的高频词“hotel”也很好体现该 POI 作为酒店这一类别的特征;POI4396 与 POI1888 同属于
餐饮行业,同时,在其类别信息中还兼顾了诸如夜店和酒吧等词汇,这些特征信息在它的主题特征分布中也能够
得到很好的表现,除了占据较大比例的主题 11 之外,主题 3 与主题 33 也都占据了较高的比例,说明该 POI 所包
含的属性信息比较丰富.
从实验结果中我们可以看出,从用户评论集中提取语义特征的方法在一定程度上能够体现出 POI 的属性
特征,这种方法的优点在于:能够将文本类的信息转换成特征向量的形式,利于模型的计算,并且具有较好的可
解释性.
ID: 393 ID: 1888
ID: 2772 ID: 4396
Fig.10 Thematic features distribution of different categories of POIs
图 10 不同类别 POI 的主题特征分布
Table 7 High-frequency words in the topic
表 7 主题中的高频词
主题编号 频率最高的前 5 个单词
3 rest, car, hotel, dark, wine
11 food, fresh, wine, dinner, server
29 Starbucks, service, milk, food, experience
33 nice, taste, brought, staff, Vegas
36 exhibits, museums, wonderful, diversion, kids
4 总结与展望
本文提出一种基于多维上下文感知的图嵌入模型的推荐方法.在引入多因素联合建模方面,我们使用主题
模型挖掘用户和 POI 的语义特征,同时融入了地理因素和时间因素,用构建图模型的方式将语义、地理和时间
等因素联合建模;在捕捉用户动态偏好方面,我们提出一种评分与语义特征相结合的偏好获取方法,通过用户的
历史评分习惯以及用户与 POI 间的语义特征相似度作为筛选条件,突出了用户的个性化特征.实验结果表明:深
层次挖掘用户和 POI 的语义特征,同时引入多因素联合建模的方法,能够有效地提高模型的推荐性能.