Page 418 - 《软件学报》2025年第9期

P. 418

钱忠胜等: 利用伪重叠判定机制的多层循环 GCN 跨域推荐 4329

(1) 在已有的用户-项目交互基础上, 针对跨域推荐中部分用户重叠场景, 创新性地改进社区聚类算法 [11] , 提出
伪重叠判定机制, 使得伪重叠用户社区面积最大化, 充分利用重叠信息并整合不同域信息学习域共享信息, 捕获用
户-用户信任关系, 进而构建源域与目标域一体化的用户网络, 提高聚类算法对跨域推荐的适应性, 从而解决聚类
结果准确性不高问题.
(2) 分别从单域和联合域网络出发, 提出了包含嵌入学习模块和图学习模块的多层循环 GCN 算法, 并利用伪
重叠判定机制得到的节点相似矩阵, 在动态图增强中学习域共享信息和域特有信息以获取高阶的跨域节点嵌入,
学习用户最新偏好, 提高数据利用率, 从而缓解数据稀疏问题.
(3) 通过 MLP 对用户-项目交互建模, 得到预测交互概率, 在 4 组关于 CDR 数据域上的对比实验结果表明,
PO-CDRec 在 MRR、NDCG 以及 HR 这 3 个评价指标上均有所提升. 此外, 还进行了消融实验分析, 验证了 PO-
CDRec 模型组件的有效性.

1 相关工作

跨域推荐旨在利用多个不同领域的数据来提供更准确、个性化更强的推荐. 在跨域推荐领域, GCN 扮演着关
键角色, 可通过学习不同领域数据之间的图结构关系提升跨域推荐的个性化程度, 但也存在图结构数据过于复杂
的问题, 通过引入聚类方法可在图中形成更清晰的群组结构, 增强数据的可解释性.
聚类方法通过距离度量方式划分数据以发现节点的相似性和规律性, 以更好地理解节点间的交互行为和关
系, 从而提供更精确和个性化的推荐. Afoudi 等人 [12] 将自组织映射方法与协同过滤相结合, 利用自组织映射对节
点聚类, 发现数据潜在的非线性模式, 更好地捕捉用户和物品间的关系, 但易造成数据过拟合, 从而降低推荐系统
的泛化性和鲁棒性. Siet 等人 [13] 在利用 Transformer 机制获取项目嵌入后, 以 K-Means 对项目嵌入分组, 并将聚类
信息与预测的评分相结合以提高个性化推荐的多样性. 但该模型对初始值的选择较敏感, 不同初始值可能会导致
聚类结果有所差别, 使结果不稳定. Chang 等人 [14] 通过基于度量学习将松散的项目序列重构为紧密的项目-项目兴
趣图, 将长期用户行为中不同类型的偏好整合到图聚类中, 并在兴趣图上进行图卷积传播以提取兴趣. 但基于度量
学习的兴趣图易受非结构化数据影响. 这类方法通过引入社交网络提高推荐准确性, 然而采用直接单一的社交关
系无法适应不同领域的用户偏好. 以上模型均基于单域推荐提出, 接下来介绍跨域推荐的聚类算法. Kang 等人 [15]
提出一种半监督框架 SSCDR, 分别学习源域和目标域度量空间的用户和项目潜在向量, 同时训练映射函数捕获两
个度量空间的跨域关系. 根据冷启动用户在源域的邻接节点推断其潜在向量为冷启动用户推荐目标域项目. Xu 等
人 [16] 提出 HCCDR 模型将软聚类方法运用于识别每个目标用户的相似用户, 并同时使用从相似用户学习到的共同
特征和用户的个人特征来学习用户的个性化偏好传递函数. 软聚类算法需计算每个数据点属于每个聚类的概率,
这在处理大规模数据集时可能影响算法效率. Liu 等人 [17] 针对隐私保护问题提出多域推荐模型 FPPDM, 通过局部
组件学习各域用户/项目偏好分布后, 利用全局聚合组件获取跨域组合用户特征, 并提出紧致性联合聚类方法对特
征相似的用户聚类以获得更紧凑的用户表示, 但多域推荐中各域数据稀疏性不同会导致各域特征分布差异大, 使
得 FPPDM 无法有效适用该聚类方法. 然而, K-Means 聚类和软聚类等传统算法往往适用于数据维度较低、样本
规模适中的场景, 而无法有效处理跨域推荐中大规模、高维度的数据集.
图神经网络方法通过构建共享图表示用户之间的关系, 学习图表示捕捉高阶非线性节点之间的依赖关系.
Wang 等人 [18] 首次将图神经网络应用于跨域社交推荐, 并提出神经社交协作排名 NSCR 方法, 利用属性感知的深
度协同过滤模型在信息导向领域学习用户-项目交互. 然而 NSCR 未能充分利用 GNN 聚合不同领域的用户信息,
导致在源域到目标域的信息扩散力度较弱. Cui 等人 [19] 提出一个异构图框架 HeroGRAPH, 该框架利用每个域内的
信息进行域内建模, 并且运用共享图上的图卷积操作进行跨域建模. 以类似的方式, Xu 等人 [20] 提出基于关系扩展
的跨域推荐模型 ReCDR. 不同于 HeroGRAPH 框架构造共享图的方式, ReCDR 利用图嵌入模型来为两个域中的
所有节点生成预训练的节点嵌入, 使得具有较高相似性的节点被连接从而设计共享图. 然而以上模型的用户行为
均在单个域中处理, 这种处理方式使跨域信息合并时很不融洽. Li 等人 [21] 提出一种嵌入式内容和异构网络模型
ECHCDR, 创造性地结合了对抗学习算法. 该模型训练生成器和鉴别器来学习用户和项目表示, 基于所学表示的内

413 414 415 416 417 418 419 420 421 422 423