Page 43 - 《软件学报》2020年第12期
P. 43

陈劲松  等:基于多维上下文感知图嵌入模型的兴趣点推荐                                                      3709


         3.3   对比方法
                   [2]
             •   JIM 是一种融合时间因素、地理因素、内容因素和口碑因素的联合概率生成模型;
             •   GeoMF [11] 是一种融合地理因素的矩阵分解模型;
             •   RankGeoFM [12] 是一种基于排序的地理因子分解模型;
             •   GE [23] 是一种融合序列效应、地理因素和时间因素的图嵌入学习模型;
             •   TAD-FPMC [19] 是一种基于时间感知的四阶张量分解模型.
         3.4   实验设计与结果分析

         3.4.1    参数设置
             在 MCAGE 模型中,有 3 个参数需要调整并优化,以使得模型的推荐性能达到最优.在生成 POI-POI 图时,
         涉及到两个待优化的参数:POI 主题特征向量的维度,即主题数 Topic 和关联阈值α;在计算图模型的嵌入向量时,
         嵌入向量维度 d 的设定也需要寻求一个最优值.故在参数设置的实验模块,我们设计了两个实验,用于探索主题
         数与阈值、嵌入向量的维度对模型的推荐性能所带来的影响.由于 Foursquare 数据集中没有用户对 POI 的评分
         数据,因此在该数据集上进行实验时,我们忽略了用户评分数据对用户偏好的影响.
             (1)  主题数与阈值的设定
             当设置的主题数不同时,LDA 主题模型所挖掘得到的主题特征向量的精确度也会产生差异.而在构建 POI-
         POI 图时,是利用 POI 的主题特征向量之间的空间距离来表示 POI 之间的相似程度,关联阈值α的设定将会影响
         到相似 POI 之间的筛选.为了确定这两个参数的最优值,我们固定空间向量的维度,调整主题数 Topic 和关联阈
         值α,并观测模型的推荐性能.其实验结果见表 2~表 5.

                        Table 2    Precision rate under different topic numbers and thresholds on Yelp
                               表 2   在 Yelp 数据集上不同主题数与阈值下的精确率
                       Topic
                    α          10       20      30       40      50       60      70
                      0.80    0.014 8   0.015 3   0.012 9   0.015 8   0.012 7   0.012 1   0.010 3
                      0.825   0.016 7   0.016 9   0.016 5   0.017 1   0.016 6   0.016 5   0.016 2
                      0.85    0.016 5   0.016 6   0.016 6   0.016 6   0.016 4   0.016 2   0.016 2
                      0.875   0.016 5   0.016 6   0.016 6   0.016 9   0.016   0.015 5   0.016 1
                      0.90    0.016 2   0.014 5   0.014 8   0.016 6   0.011 9   0.010 9   0.010 2

                     Table 3    Precision rate under different topic numbers and thresholds on Foursquare
                             表 3   在 Foursquare 数据集上不同主题数与阈值下的精确率
                         Topic
                      α          10     20      30      40      50      60      70
                        0.80   0.011 4   0.011 1   0.012 2   0.012 6   0.012 7   0.012 6   0.012 3
                        0.825   0.012 6   0.013 1   0.012 8   0.013 5   0.013 6   0.013 6   0.013 5
                        0.85   0.012 6   0.012 9   0.013 0   0.012 8   0.013 3   0.013 4   0.013 3
                        0.875   0.012 5   0.012 7   0.013 1   0.013 5   0.013 5   0.013 5   0.013 4
                        0.90   0.011 6   0.012 0   0.012 1   0.012 1   0.012 0   0.012 0   0.011 9
                         Table 4    Recall rate under different topic numbers and thresholds on Yelp
                               表 4   在 Yelp 数据集上不同主题数与阈值下的召回率
                         Topic
                      α          10     20      30      40      50      60      70
                        0.80   0.050 2   0.051 8   0.043 7   0.053 5   0.043 1   0.041 1   0.034 5
                        0.825   0.056 8   0.057 5   0.055 9   0.058 1   0.056 4   0.056 2   0.054 9
                        0.85   0.055 9   0.056 4   0.056 4   0.056 4   0.055 7   0.055 1   0.054 9
                        0.875   0.055 9   0.056 4   0.056 4   0.057 2   0.054 4   0.052 7   0.054 6
                        0.90   0.055 1   0.049 3   0.050 3   0.056 4   0.040 4   0.037 2   0.034 5
   38   39   40   41   42   43   44   45   46   47   48