Page 430 - 《软件学报》2025年第9期
P. 430
钱忠胜 等: 利用伪重叠判定机制的多层循环 GCN 跨域推荐 4341
表 6 Game-Video 数据域中推荐模型性能比较 (续)
Game-domain recommendation Video-domain recommendation
模型 NDCG HR NDCG HR
MRR MRR
@5 @10 @5 @10 @5 @10 @5 @10
SSCDR 1.98±0.03 1.27±0.01 1.59±0.03 1.96±0.03 3.48±0.06 2.55±0.03 1.86±0.02 2.61±0.02 3.14+0.06 5.51±0.08
CDAML 2.78+0.04 1.83+0.02 2.88±0.06 3.53±0.05 5.84±0.13 3.73±0.04 2.61±0.05 3.79±0.06 4.20+0.01 7.46±0.13
HCCDR 3.12±0.12 2.17±0.14 2.78±0.16 3.45±0.31 5.60±0.21 3.79+0.09 2.95±0.12 3.93±0.14 4.39±0.17 7.48±0.32
FPPDM 4.43±0.15 3.23+0.10 3.68±0.06 5.47±0.04 7.16±0.02 3.95+0.14 3.36±0.03 4.57±0.16 5.69±0.08 9.35±0.05
PPGN 2.77±0.06 1.90±0.09 2.84±0.10 3.07+0.14 5.98±0.32 3.90±0.11 3.04±0.07 4.06±0.16 4.53+0.09 7.68±0.32
2
I RCDR 2.52±0.05 1.97±0.02 2.58±0.07 3.40±0.05 5.36±0.09 3.97±0.07 3.15±0.07 4.41±0.08 4.95±0.05 8.85±0.11
GLOU 4.52±0.16 3.71±0.11 4.58±0.13 5.44±0.21 8.61±0.30 4.75±0.13 4.65±0.01 5.49±0.14 7.41±0.21 12.11±0.23
PO-CDRec 4.87±0.12 3.87±0.07 4.92±0.04 5.61±0.09 9.17±0.01 5.02±0.15 4.68±0.02 5.68±0.16 7.52±0.24 12.18±0.13
3.4.1.1 与单域推荐模型对比
对比模型 TCCF 和 NGCF 分别是基于改进聚类方法和图神经网络的单域推荐模型, 性能在许多方面都优于
CML. 例如, 在表 6 中 Game-Video 的 CDR 场景下, TCCF 模型的 MRR 值比 CML 模型平均提升 37.64%. 这证实
了捕获高阶邻居信息以及改进用户聚类算法对于用户和项目表示的学习具有一定帮助.
在多数推荐场景下, NGCF 模型性能略优于 TCCF. 例如, 在表 5 中 Cloth-Sport 的 CDR 场景下, NGCF 模型的
NDCG@5、HR@5 值比 TCCF 模型分别平均提升 5.7% 和 8.17%. 这表明在单域推荐中, 使用 GCN 捕获高阶邻居
信息相较于改进用户聚类算法对推荐性能的提升会产生更大影响.
相较于 3 个对应的单域推荐模型, 跨域框架 EMCDR 可更好地适配于跨域推荐场景, 其实验效果取得显著的
改进. 例如, 在表 4 中 Phone-Elec 的 CDR 场景下, EMCDR(CML)、EMCDR(TCCF)、EMCDR(NGCF) 的 HR@10
值相较于其对应的单域模型 CML、TCCF、NGCF 分别平均提升 9.23%、14.24%、3.06%. 这主要因为传统单域
方法未考虑跨域差异, 难以辨别冷启动用户的信息传输.
表 3–表 6 的实验结果表明, 这些方法虽然在一定程度上有效, 但均仅基于单域方式进行推荐, 模型的泛化能
力不足, 很难适应不同领域的推荐任务, 同时也初步验证本文模型中对聚类方法以及 GCN 模块改进的有效性.
3.4.1.2 与跨域推荐模型对比
相比于对应的单域推荐模型 CML、TCCF 和 NGCF 而言, 基于 EMCDR 框架的跨域推荐模型 EMCDR
(CML)、EMCDR(TCCF) 和 EMCDR(NGCF) 性能更为突出. 这验证了跨域框架 EMCDR 在缓解冷启动问题上具
有一定的可行性. 由表 3–表 6 可知, EMCDR(TCCF) 和 EMCDR(NGCF) 在所有数据域中表现均高于 EMCDR
(CML). 例如, 在 Game 数据域上, EMCDR(TCCF) 和 EMCDR(NGCF) 的 MRR 值比 EMCDR(CML) 分别提高
12.40%、14.17%. 这表明基于改进的聚类算法和图神经网络策略可较好地适应跨域推荐.
表 4 和表 6 的 Phone 数据域、Game 数据域的结果中, EMCDR 的方法改进非常有限, 甚至在某些情况下比它
们对应的单域推荐模型更差, 其中在 Phone 数据域对应的 MRR 值平均下降 1.07%, 这表明简单的跨域映射不足以
描述跨域用户表示的复杂映射关系.
对比模型 STAR 和 PPGN 相对于单域推荐模型而言, 性能未有明显提升, 是因为这些方法侧重于信息传递来
增强重叠用户推荐, 并且易给冷启动用户生成有偏见的表示.
为提高映射函数的能力, SSCDR 考虑用户-项目多跳邻居信息以增强 EMCDR(CML) 的函数映射效果. 表 3–
表 6 中除了表 5 的 Cloth-Sport 数据域外, SSCDR 在其他数据域的指标反而普遍不如 EMCDR(CML), 其中在
Music 数据域中, SSCDR 模型的 MRR 值比 EMCDR(CML) 模型降低 48.68%. 这是因为 SSCDR 对初始化的预训练
表示较为敏感.
CDAML、HCCDR、FPPDM 均采用聚类方法生成用户共同特征, 模型性能在多数情况下高于利用 EMCDR
框架的基线模型. 其中在表 5 中 Cloth-Sport 的 CDR 场景下, CDAML、HCCDR、FPPDM 的 NDCG@5 值比
EMCDR(TCCF) 模型分别提升 0.69%、10.73%、15.2%, 这表明在 CDR 中聚类方法是有效的.

