Page 433 - 《软件学报》2025年第9期
P. 433

4344                                                       软件学报  2025  年第  36  卷第  9  期


                 更有效地增强模型在       MRR、NDCG@10、HR@10     指标上的效果.

                 3.4.3    参数敏感度分析  (RQ3)
                    这里对两个关键参数展开实验讨论, 即传播深度和重叠用户影响权重, 分析它们在不同数据集上对模型性能
                 的影响.

                 3.4.3.1    传播深度
                    我们设置传播深度为参数          K, K∈{0, 1, 2, 3, 4}. 当  K=0  时, 图卷积部分消失, 多层循环  GCN  模块退化为贝叶斯
                 个性化排序    (Bayesian personalized ranking, BPR). 不同传播层的实验结果如图  4  所示.

                         19                                      28
                                                                 24
                        评价指标  14 9                              评价指标  20
                                                                 16
                                                                 12
                                                                  8
                          4                                       4
                             0     1     2    3     4                 0     1     2    3     4
                                      传播深度                                     传播深度
                             (a) 传播深度对 Music→Movie 的影响                (b) 传播深度对 Phone→Elec 的影响
                         16                                       16
                         14                                       14
                        评价指标  10 8                               评价指标  10 8
                         12
                                                                  12
                          6                                       6
                          4                                       4
                             0     1     2    3     4                 0     1    2     3     4
                                       传播深度                                    传播深度
                              (c) 传播深度对 Cloth→Sport 的影响               (d) 传播深度对 Game→Video 的影响
                                                 MRR       NDCG@10        HR@10
                                                    图 4 传播深度的影响

                    由图  4  可知, 当  K  值为  0  时, 此时推荐指标均较小, 推荐性能较差. 当       K  由  0  变为  1  时, 模型性能提升明显, 表
                 明  GCN  层可有效解决数据稀疏问题. 随着         K  的不断增大, 模型性能并未呈现不断增涨趋势, 而是在某个值之后下
                 降. 在数据域   Music-Movie、Cloth-Sport、Game-Video  中  K=3  时以及数据域  Phone-Elec 中  K=2  时模型性能达到
                 最佳. 原因在于, 对于稀疏数据集, 更深的图卷积可帮助聚合更多的邻居, 利于用户嵌入的学习, 从而提高冷启动用
                 户的推荐准确率; 而对于密集数据集, 过高的传播层深度易导致                   GNN  出现过度平滑现象.

                 3.4.3.2    重叠用户影响权重
                    为获取伪重叠用户社区, 使用          λ 作为重叠用户影响权重, 以衡量伪重叠判定机制所构建的用户社区对用户聚
                 类准确性的影响, 其值在{0.005, 0.01, 0.05, 0.1, 0.15, 0.2, 0.25, 0.3, 0.35, 0.4, 0.45, 0.5}中选取. 将  MRR, NDCG@10
                 作为评价指标, 验证      λ 的不同取值对推荐效果的影响, 如后文图            5  所示.
                    由图  5  可知, 随着  λ 值的变化, 不同数据域下的推荐指标           MRR  和  NDCG@10  呈现先增后降的趋势. 第       3.4.2
                 节消融实验中的变体模型          Ours-2  可看作  λ  值为  0  时的情况, 此时推荐指标均为最小, 推荐性能较差. 在数据域
                 Music-Movie 中, 当重叠用户影响权重取值为         0.25  时, 推荐性能达到最佳; 在数据域       Cloth-Sport、Game-Video、
                 Phone-Elec 中, λ 值为  0.3  时, 推荐性能达到最佳. 这表明, 通过调整    λ 值的大小, 可优化推荐性能.

                 3.4.4    模型复杂度分析
                    为充分获取重叠用户信息, 所提模型            PO-CDRec 在社区聚类算法      Louvain  的基础上设计伪重叠判定机制, 据
                 此挖掘用户的信任关系以及相似用户社区, 再结合提出的包含嵌入学习模块和图学习模块的多层循环                                  GCN, 学习
                 动态的域共享特征、域特有特征以及动态图结构, 并通过两模块的循环增强, 获取最新用户偏好, 进而对用户推荐
                 项目. 与现有相关模型相比, PO-CDRec 的推荐过程稍长, 复杂度相对有所增加, 但推荐效果得到较大提升                          (见表  3–
   428   429   430   431   432   433   434   435   436   437   438