Page 431 - 《软件学报》2025年第9期
P. 431

4342                                                       软件学报  2025  年第  36  卷第  9  期


                     2
                    I RCDR  与  GLOU  都是基于  GCN  的跨域推荐模型, 与基于      EMCDR  框架的基线模型相比, 这两个模型性能均
                 得到一定改进, 其中在表       3  中  Music-Movie 的  CDR  场景下, I RCDR  模型的  NDCG@5  值比  EMCDR(NGCF) 模型
                                                                2
                 平均提升   4.9%, 而  GLOU  模型的  NDCG@5  值比  EMCDR(NGCF) 模型平均提升     26.09%. GLOU  模型实验效果优
                    2
                 于  I RCDR、CDAML、HCCDR、FPPDM      模型, 在对比模型中表现最佳, 主要是因为            GLOU  模型在使用    GCN  提
                 取节点特征前会根据偏好差异对用户分组, 这表明将聚类方法与                     GCN  相结合是可行的.
                    表  3–表  6  的实验结果表明, 基于改进的聚类方法和图神经网络策略在                 CDR  中均取得一定效果. 与这些模型
                 不同的是, 所提模型      PO-CDRec 改进聚类算法的同时还考虑了用户和项目的高阶嵌入关系, 使其具备更强优势.
                    综上分析, 相较于之前的        CDR  模型, 本文模型   PO-CDRec 在所有数据域的评价指标中均获得较好的表现. 与
                 对比模型中表现最佳的        GLOU  模型相比, 在    Music-Movie、Phone-Elec、Cloth-Sport 和  Game-Video  这  4  组数据
                 域上, 所提模型    PO-CDRec 的  MRR  值最少提升  6.55%, 2.65%, 6.41%, 6.29%; NDCG@N  值最少提升 4.85%, 1.26%,
                 2.39%, 2.38%; HR@N  值最少提升  0.77%, 1.19%, 2.61%, 2.25%.
                    从对比结果来看, 本文模型         PO-CDRec  在  Music-Movie、Phone-Elec  数据域中的表现更好. 相对于      Cloth-
                 Sport 与  Game-Video  这两组数据域, 模型的  HR@N  值在  Music-Movie 数据域中分别最少提升        9.27%  和  28.51%,
                 而在  Phone-Elec 数据域中分别最少提升      38.69%  和  44.29%.
                    本文模型    PO-CDRec 在  Music-Movie 与  Phone-Elec 数据域上表现更出色的原因在于, 这两组数据域中的重叠
                 用户信息更多, 模型适应性更强. 一方面, 模型           PO-CDRec 中的伪重叠判定机制模块运用了基于重叠用户改进的社
                 区聚类算法, 可适用于大规模数据集, 能有效处理不同领域的复杂用户关系; 另一方面, 多层循环                             GCN  模块可提
                 取并融合不同领域信息的共性与特性, 并通过高阶表示建模方式获取准确的用户偏好. 然而, 本文模型对重叠用户
                 数据依赖性较强, 即当重叠用户交互信息匮乏时, 此时模型仅运用到多层循环                        GCN  建模域内、域间关系, 难以发
                 挥伪重叠判定机制的优势. 可见, 本文模型            PO-CDRec 在数据集较大、重叠用户交互数据较多的部分用户重叠场
                 景下会有更好的表现.

                 3.4.2    消融实验分析  (RQ2)
                    为验证伪重叠判定机制和多层循环             GCN  这两个构件对跨域推荐模型性能的影响, 设计了              3  种变体模型, 分别
                 是  Ours-1、Ours-2  和  Ours-3, 将它们与本文模型  PO-CDRec 进行对比. 其中, 变体模型     Ours-1  不使用伪重叠判定
                 机制与多层循环      GCN, 通过  Louvain  算法分别对两域数据聚类, 并使用传统          GCN  学习节点特征, 主要验证两个构
                 件的作用; 变体模型      Ours-2  不采用伪重叠判定机制对跨域用户聚类, 而是对每个数据域使用                   Louvain  算法聚类相
                 似用户群体, 并通过多层循环         GCN  捕获用户偏好, 主要验证多层循环          GCN  构件获取用户偏好的有效性; 变体模
                 型  Ours-3  不使用多层循环   GCN, 而仅通过固定图结构学习节点特征, 不考虑不同域间节点的关系, 主要阐明伪重
                 叠判定机制构件对跨域推荐聚类效果的准确性. 各模型的构件描述情况如表                         7  所示.

                                                 表 7 各模型的构件描述情况

                                 变体模型                 伪重叠判定机制                  多层循环GCN
                                  Ours-1                   ×                       ×
                                  Ours-2                   ×                       √
                                  Ours-3                   √                       ×
                                 PO-CDRec                  √                       √

                    在  Amazon  数据集中选择   4  组数据域进行消融实验, 分别是: Music-Movie、Phone-Elec、Cloth-Sport、Game-
                 Video, 考虑到变体模型的目的是验证模型构件对推荐性能的影响, 这里选择                     MRR、NDCG@10、HR@10      作为评
                 价指标. 实验结果如表      8  所示, 其中, 为便于比较, 利用下划线来突显变体模型中表现最佳的数据, 最后一列给出本
                 文模型相对于某一最佳变体模型的性能对比情况.
                    根据表   8, 各构件的实验分析如下: 伪重叠判定机制对模型性能影响较大, 传统的跨域推荐聚类方法在                             MRR,
                 NDCG@10, HR@10  这  3  个指标上的表现均不如伪重叠判定机制方法; 固定图结构                 GCN  学习节点特征在这      3  个
                 指标上的表现均不如多层循环           GCN  方法; 而去除伪重叠判定机制或多层循环             GCN  单个构件的模型与将二者结
                 合的本文模型相比, 其效果明显更差. 下面给出更详细的分析.
   426   427   428   429   430   431   432   433   434   435   436