Page 430 - 《软件学报》2025年第9期
P. 430

钱忠胜 等: 利用伪重叠判定机制的多层循环             GCN  跨域推荐                                     4341


                                         表 6    Game-Video 数据域中推荐模型性能比较      (续)

                                   Game-domain recommendation             Video-domain recommendation
                   模型                 NDCG             HR                     NDCG             HR
                           MRR                                     MRR
                                    @5     @10     @5      @10             @5     @10      @5      @10
                  SSCDR   1.98±0.03 1.27±0.01 1.59±0.03  1.96±0.03 3.48±0.06  2.55±0.03 1.86±0.02 2.61±0.02  3.14+0.06  5.51±0.08
                  CDAML   2.78+0.04 1.83+0.02 2.88±0.06  3.53±0.05 5.84±0.13  3.73±0.04 2.61±0.05 3.79±0.06  4.20+0.01  7.46±0.13
                  HCCDR   3.12±0.12 2.17±0.14 2.78±0.16  3.45±0.31 5.60±0.21  3.79+0.09 2.95±0.12 3.93±0.14  4.39±0.17  7.48±0.32
                  FPPDM   4.43±0.15 3.23+0.10 3.68±0.06  5.47±0.04 7.16±0.02  3.95+0.14 3.36±0.03 4.57±0.16  5.69±0.08  9.35±0.05
                   PPGN   2.77±0.06 1.90±0.09 2.84±0.10  3.07+0.14 5.98±0.32  3.90±0.11 3.04±0.07 4.06±0.16  4.53+0.09  7.68±0.32
                   2
                  I RCDR  2.52±0.05 1.97±0.02 2.58±0.07  3.40±0.05 5.36±0.09  3.97±0.07 3.15±0.07 4.41±0.08  4.95±0.05  8.85±0.11
                   GLOU   4.52±0.16 3.71±0.11 4.58±0.13  5.44±0.21 8.61±0.30  4.75±0.13 4.65±0.01 5.49±0.14  7.41±0.21 12.11±0.23
                 PO-CDRec 4.87±0.12 3.87±0.07 4.92±0.04  5.61±0.09 9.17±0.01  5.02±0.15 4.68±0.02 5.68±0.16  7.52±0.24 12.18±0.13
                 3.4.1.1    与单域推荐模型对比
                    对比模型    TCCF  和  NGCF  分别是基于改进聚类方法和图神经网络的单域推荐模型, 性能在许多方面都优于
                 CML. 例如, 在表  6  中  Game-Video  的  CDR  场景下, TCCF  模型的  MRR  值比  CML  模型平均提升  37.64%. 这证实
                 了捕获高阶邻居信息以及改进用户聚类算法对于用户和项目表示的学习具有一定帮助.
                    在多数推荐场景下, NGCF       模型性能略优于      TCCF. 例如, 在表  5  中  Cloth-Sport 的  CDR  场景下, NGCF  模型的
                 NDCG@5、HR@5    值比  TCCF  模型分别平均提升      5.7%  和  8.17%. 这表明在单域推荐中, 使用    GCN  捕获高阶邻居
                 信息相较于改进用户聚类算法对推荐性能的提升会产生更大影响.
                    相较于   3  个对应的单域推荐模型, 跨域框架          EMCDR  可更好地适配于跨域推荐场景, 其实验效果取得显著的
                 改进. 例如, 在表   4  中  Phone-Elec 的  CDR  场景下, EMCDR(CML)、EMCDR(TCCF)、EMCDR(NGCF) 的  HR@10
                 值相较于其对应的单域模型          CML、TCCF、NGCF     分别平均提升     9.23%、14.24%、3.06%. 这主要因为传统单域
                 方法未考虑跨域差异, 难以辨别冷启动用户的信息传输.
                    表  3–表  6  的实验结果表明, 这些方法虽然在一定程度上有效, 但均仅基于单域方式进行推荐, 模型的泛化能
                 力不足, 很难适应不同领域的推荐任务, 同时也初步验证本文模型中对聚类方法以及                          GCN  模块改进的有效性.

                 3.4.1.2    与跨域推荐模型对比
                    相比于对应的单域推荐模型            CML、TCCF   和  NGCF  而言, 基于  EMCDR   框架的跨域推荐模型        EMCDR
                 (CML)、EMCDR(TCCF) 和   EMCDR(NGCF) 性能更为突出. 这验证了跨域框架            EMCDR  在缓解冷启动问题上具
                 有一定的可行性. 由表       3–表  6  可知, EMCDR(TCCF) 和  EMCDR(NGCF) 在所有数据域中表现均高于            EMCDR
                 (CML). 例如, 在  Game  数据域上, EMCDR(TCCF) 和    EMCDR(NGCF) 的   MRR  值比  EMCDR(CML) 分别提高
                 12.40%、14.17%. 这表明基于改进的聚类算法和图神经网络策略可较好地适应跨域推荐.
                    表  4  和表  6  的  Phone 数据域、Game 数据域的结果中, EMCDR    的方法改进非常有限, 甚至在某些情况下比它
                 们对应的单域推荐模型更差, 其中在           Phone 数据域对应的     MRR  值平均下降   1.07%, 这表明简单的跨域映射不足以
                 描述跨域用户表示的复杂映射关系.
                    对比模型    STAR  和  PPGN  相对于单域推荐模型而言, 性能未有明显提升, 是因为这些方法侧重于信息传递来
                 增强重叠用户推荐, 并且易给冷启动用户生成有偏见的表示.
                    为提高映射函数的能力, SSCDR         考虑用户-项目多跳邻居信息以增强            EMCDR(CML) 的函数映射效果. 表       3–
                 表  6  中除了表  5  的  Cloth-Sport 数据域外, SSCDR  在其他数据域的指标反而普遍不如          EMCDR(CML), 其中在
                 Music 数据域中, SSCDR  模型的   MRR  值比  EMCDR(CML) 模型降低    48.68%. 这是因为  SSCDR  对初始化的预训练
                 表示较为敏感.
                    CDAML、HCCDR、FPPDM      均采用聚类方法生成用户共同特征, 模型性能在多数情况下高于利用                        EMCDR
                 框架的基线模型. 其中在表         5  中  Cloth-Sport 的  CDR  场景下, CDAML、HCCDR、FPPDM   的  NDCG@5  值比
                 EMCDR(TCCF) 模型分别提升      0.69%、10.73%、15.2%, 这表明在   CDR  中聚类方法是有效的.
   425   426   427   428   429   430   431   432   433   434   435