Page 431 - 《软件学报》2025年第9期
P. 431
4342 软件学报 2025 年第 36 卷第 9 期
2
I RCDR 与 GLOU 都是基于 GCN 的跨域推荐模型, 与基于 EMCDR 框架的基线模型相比, 这两个模型性能均
得到一定改进, 其中在表 3 中 Music-Movie 的 CDR 场景下, I RCDR 模型的 NDCG@5 值比 EMCDR(NGCF) 模型
2
平均提升 4.9%, 而 GLOU 模型的 NDCG@5 值比 EMCDR(NGCF) 模型平均提升 26.09%. GLOU 模型实验效果优
2
于 I RCDR、CDAML、HCCDR、FPPDM 模型, 在对比模型中表现最佳, 主要是因为 GLOU 模型在使用 GCN 提
取节点特征前会根据偏好差异对用户分组, 这表明将聚类方法与 GCN 相结合是可行的.
表 3–表 6 的实验结果表明, 基于改进的聚类方法和图神经网络策略在 CDR 中均取得一定效果. 与这些模型
不同的是, 所提模型 PO-CDRec 改进聚类算法的同时还考虑了用户和项目的高阶嵌入关系, 使其具备更强优势.
综上分析, 相较于之前的 CDR 模型, 本文模型 PO-CDRec 在所有数据域的评价指标中均获得较好的表现. 与
对比模型中表现最佳的 GLOU 模型相比, 在 Music-Movie、Phone-Elec、Cloth-Sport 和 Game-Video 这 4 组数据
域上, 所提模型 PO-CDRec 的 MRR 值最少提升 6.55%, 2.65%, 6.41%, 6.29%; NDCG@N 值最少提升 4.85%, 1.26%,
2.39%, 2.38%; HR@N 值最少提升 0.77%, 1.19%, 2.61%, 2.25%.
从对比结果来看, 本文模型 PO-CDRec 在 Music-Movie、Phone-Elec 数据域中的表现更好. 相对于 Cloth-
Sport 与 Game-Video 这两组数据域, 模型的 HR@N 值在 Music-Movie 数据域中分别最少提升 9.27% 和 28.51%,
而在 Phone-Elec 数据域中分别最少提升 38.69% 和 44.29%.
本文模型 PO-CDRec 在 Music-Movie 与 Phone-Elec 数据域上表现更出色的原因在于, 这两组数据域中的重叠
用户信息更多, 模型适应性更强. 一方面, 模型 PO-CDRec 中的伪重叠判定机制模块运用了基于重叠用户改进的社
区聚类算法, 可适用于大规模数据集, 能有效处理不同领域的复杂用户关系; 另一方面, 多层循环 GCN 模块可提
取并融合不同领域信息的共性与特性, 并通过高阶表示建模方式获取准确的用户偏好. 然而, 本文模型对重叠用户
数据依赖性较强, 即当重叠用户交互信息匮乏时, 此时模型仅运用到多层循环 GCN 建模域内、域间关系, 难以发
挥伪重叠判定机制的优势. 可见, 本文模型 PO-CDRec 在数据集较大、重叠用户交互数据较多的部分用户重叠场
景下会有更好的表现.
3.4.2 消融实验分析 (RQ2)
为验证伪重叠判定机制和多层循环 GCN 这两个构件对跨域推荐模型性能的影响, 设计了 3 种变体模型, 分别
是 Ours-1、Ours-2 和 Ours-3, 将它们与本文模型 PO-CDRec 进行对比. 其中, 变体模型 Ours-1 不使用伪重叠判定
机制与多层循环 GCN, 通过 Louvain 算法分别对两域数据聚类, 并使用传统 GCN 学习节点特征, 主要验证两个构
件的作用; 变体模型 Ours-2 不采用伪重叠判定机制对跨域用户聚类, 而是对每个数据域使用 Louvain 算法聚类相
似用户群体, 并通过多层循环 GCN 捕获用户偏好, 主要验证多层循环 GCN 构件获取用户偏好的有效性; 变体模
型 Ours-3 不使用多层循环 GCN, 而仅通过固定图结构学习节点特征, 不考虑不同域间节点的关系, 主要阐明伪重
叠判定机制构件对跨域推荐聚类效果的准确性. 各模型的构件描述情况如表 7 所示.
表 7 各模型的构件描述情况
变体模型 伪重叠判定机制 多层循环GCN
Ours-1 × ×
Ours-2 × √
Ours-3 √ ×
PO-CDRec √ √
在 Amazon 数据集中选择 4 组数据域进行消融实验, 分别是: Music-Movie、Phone-Elec、Cloth-Sport、Game-
Video, 考虑到变体模型的目的是验证模型构件对推荐性能的影响, 这里选择 MRR、NDCG@10、HR@10 作为评
价指标. 实验结果如表 8 所示, 其中, 为便于比较, 利用下划线来突显变体模型中表现最佳的数据, 最后一列给出本
文模型相对于某一最佳变体模型的性能对比情况.
根据表 8, 各构件的实验分析如下: 伪重叠判定机制对模型性能影响较大, 传统的跨域推荐聚类方法在 MRR,
NDCG@10, HR@10 这 3 个指标上的表现均不如伪重叠判定机制方法; 固定图结构 GCN 学习节点特征在这 3 个
指标上的表现均不如多层循环 GCN 方法; 而去除伪重叠判定机制或多层循环 GCN 单个构件的模型与将二者结
合的本文模型相比, 其效果明显更差. 下面给出更详细的分析.

