Page 427 - 《软件学报》2025年第9期
P. 427

4338                                                       软件学报  2025  年第  36  卷第  9  期


                 化折损累计增益      (normalize discounted cumulative gain, NDCG)、命中率  (hit rate, HR) 这  3  个评价指标对其性能进
                 行评价.
                    1) 平均倒数秩. 它是准确推荐项目倒数秩的平均值, 当所有秩位置超过                    n  时, 倒数秩设为  0, 如公式  (17) 所示.

                                                           1  n ∑  1
                                                     MRR =                                           (17)
                                                           n   rank u
                                                             u=1
                 其中, n  表示用户数, rank u 表示第  u  个用户的排名.
                    2) 归一化折损累计增益. 它表示准确推荐项目在推荐列表中位置越靠前, 其贡献越大, 反之贡献越小, 如公式
                 (18) 所示.

                                                        ∑   1  n ∑  2 − 1
                                                                   t i
                                                 NDCG =                                              (18)
                                                            Y u  log (i+1)
                                                        u∈U test  i=1  2
                 其中, U tes 表示用户测试集, Y u 表示用户真实值, t i 表示项目      i 在推荐列表中的位置.
                        t
                    3) 命中率. 它强调模型推荐的准确性, 即用户的需求项是否包含在模型的推荐列表中, 如公式                          (19) 所示.

                                                          1  ∑ s
                                                      HR =      hit(i)                               (19)
                                                          s   i=1
                 其中, s 为样本数, 可理解为用户需求项的数目. hit(i) 用于表示第             i 个项目是否包含在模型推荐的项目列表中, 若
                 是, 则其值为   1; 否则为  0.

                 3.3   对比模型
                    因  PO-CDRec 属于  CDR  领域范畴, 故将其与经典的、先进的          CDR  方法进行比较. 与本文模型        PO-CDRec 作
                 对比的   12  种模型包括   3  个单域推荐模型和     9  个跨域推荐模型. 在单域推荐模型中, CML          [26] 为推荐领域的经典模
                 型; TCCF [27] 将改进的聚类算法应用在推荐模型中, 与本文模型的伪重叠判定机制有一定联系; NGCF                         [28] 是基于
                 GCN  的经典推荐方法, 与本文模型的多层循环               GCN  模块有一定相关性. 在跨域推荐模型中, EMCDR              [29] 和
                 STAR [30] 均为跨域推荐中的经典模型; SSCDR、CDAML        [31] 、HCCDR、FPPDM  为适配跨域推荐分别对聚类方法
                 进行不同方面的改进, 与本文模型的伪重叠判定机制具有相似性, 其中                     SSCDR  在  EMCDR  基础上拓展; PPGN  [32] 、
                 2     [33]     [34]
                 I RCDR  、GLOU    分别运用   GCN  学习跨域推荐中不同角度的嵌入表示, 与本文模型的多层循环                     GCN  模块具
                 有一定相关性.
                    单域推荐: 两个域的所有交互被合并为一个域, 应用以下广泛使用的基于                       CF  的方法.
                    1) CML  在度量学习思想下学习用户和项目表示, 该度量学习思想利用                   L2  距离并假设用户表示与交互项目的
                 距离小于尚未交互的项目.
                    2) TCCF  引入布谷鸟搜索算法改进       K-Means 算法聚合用户, 并利用时间相关系数捕捉用户行为的时间模式.
                    3) NGCF  是一种典型的基于图神经网络学习用户和项目表示的方法, 它堆叠                     3  层  GCN  以探索用户和项目间
                 的高阶连接信息.
                    跨域推荐: 跨域推荐模型分别为每个域学习不同的用户-项目表示, 下面是几种典型的跨域基线模型.
                    1) EMCDR  是第  1  个为冷启动用户提供     CDR  的推荐框架, 其采用     3  种不同的预训练方法, 包括       CML、TCCF
                 和  NGCF, 分别初始化   EMCDR  中的用户-项目表示, 称为       EMCDR(CML)、EMCDR(TCCF) 和    EMCDR(NGCF).
                    2) STAR  设计了一个编码器拓扑结构, 并为所有域引入一个共享的基础网络来传输知识.
                    3) SSCDR  对  EMCDR  进行扩展, 先通过   CML  方法预训练表示, 再利用聚合重叠用户的多跳相邻信息学习跨
                 域映射函数.
                    4) CDAML  提出一种软聚类的方法, 在更细粒度的聚类级别指导全局共享参数初始化, 并通过对抗学习转移
                 与领域无关的用户偏好以改进目标领域的推荐.
                    5) HCCDR  采用软聚类的方法来识别每个目标用户的相似用户, 并同时结合从相似用户中学习到的共同特征
                 和自身特征以获取用户的个性化偏好传递函数.
   422   423   424   425   426   427   428   429   430   431   432