Page 260 - 《软件学报》2021年第12期
P. 260
3924 Journal of Software 软件学报 Vol.32, No.12, December 2021
(a) HR@10 (b) NDCG@10
Fig.2 HR@10 and NDCG@10 of models with different potential vector dimension in MovieLens
图 2 MovieLens 数据集下不同潜在向量维度模型的 HR@10 和 NDCG@10
(a) HR@10 (b) NDCG@10
Fig.3 HR@10 and NDCG@10 of models with different potential vector dimension in Anime
图 3 Anime 数据集下不同潜在向量维度模型的 HR@10 和 NDCG@10
• Result 3:负样本采样数影响
BPR 损失函数关注的是成对排序损失,即最大化正样本与负样本之间的排序.构造训练集时,正负样本采样
率固定为 1:1 来采集数据样本.而 DMF 和 MLP 采用 Log Loss,其关注重点为逐点损失,一般通过最小化预测值 ˆ y
和目标值 y 之间的平方误差来更新参数,具有灵活的负样本采样特点.为了探究负样本采样数对模型推荐性能
的影响,我们在负样本采样数为 1,3,5,7 和 9 的情况下,分别将 BPR,GMF 和 DMF 这 3 个模型在 MovieLens 和
Anime 两个数据集上进行了训练,得到了模型的 HR@10 和 NDCG@10 指标表现情况,结果如图 4 和图 5 所示.
(a) HR@10 (b) NDCG@10
Fig.4 HR@10 and NDCG@10 of models with different number of negative samples collected in MovieLens
图 4 MovieLens 数据集下不同负样本采集数模型的 HR@10 和 NDCG@10