Page 423 - 《软件学报》2025年第9期

P. 423

4334 软件学报 2025 年第 36 卷第 9 期

空间, 获取用户-项目偏好, 学习方式如公式 (8) 所示.

 
 < x (k+1) × F 1 , x (k+1) × F 2 > 

a (k+1) = σ  u i     (8)


ui
(k+1)
 (k+1)
x u × F 1 x × F 2 
i
其中, a (k+1) 表示第 (k+1) 层得到的用户-项目偏好, σ(·) 是 sigmoid 函数, 将相似度归一化在 (0, 1) 区间内, F 1 和 F 2
ui
是两个可训练的矩阵, <·>表示向量内积操作.

a T
a O
节 (k) (k) 动态阈值 (k) a S
X u X i a ui
点 z S
嵌 θ(k) 门
入聚合控
a (k)
神
经 z T
...
θ(k) 网
... ...
... ... 络
... ... ...
计算
θ(k) 图
学
获取初步偏好动态剪枝习
图 3 多层循环 GCN 图

当输入数据维数较大时, 公式 (8) 所得的偏好矩阵会过于稠密, 同时结合前文中使用的伪重叠判定机制, 模块
计算时间和内存使用量成倍增长, 而对于大规模数据集, 内存消耗会较高, 很可能导致计算设备内存不足. 故无法
直接运用于 GCN, 需对得到的用户-项目偏好矩阵进行稀疏化处理.
许多模型在稀疏化处理过程中采用幅度剪枝 (magnitude pruning, MaP) 方法 [24] , 但 MaP 侧重于局部信息, 忽
略全局结构和权重间的关联. 另外, 相似度较小的数据剪枝也可能导致模型性能下降. 为应对此问题, 我们使用自
适应方法, 基于相似度的幅度设定相应阈值, 在训练过程中动态调整, 从而使偏好矩阵不过于稠密. 对于每位用户
对应项目的偏好与上一轮的阈值共同构成该层的预测阈值.
为更充分地利用图数据, 避免过度剪枝可能导致的性能下降, 在训练过程中, 使用动态调整机制 [25] 对不同用
户或不同情境自适应调整, 以更灵活地应对局部信息和全局结构的变化. 同时, 为平衡剪枝过程中各轮次之间的关
系, 并确保每一轮的剪枝阈值更加独立和合理, 设置权重参数, 使得每一轮的剪枝比例逐渐降低, 从而减少前几轮
对后续轮次的影响. 这里通过自适应幅度剪枝进行动态调整, 动态阈值及剪枝如公式 (9)、(10) 所示.

θ ui (k) = αa (k−1) +(1−α)θ ui (k −1) (9)
ui

(k)
(k)
 a , a ⩾ θ ui (k)

(k)  ui ui
ui  0, a < θ ui (k)
(k)
a =  (10)

ui
其中, θ ui (k) 是动态阈值, α 为权重参数, 决定历史数据对当前的影响程度.
每层均对用户 u 所有项目偏好计算, 得到该层的偏好向量, 经过 K 步聚合传播后, 获得用户最终嵌入向量, 如
公式 (11) 所示.

(k)
(0)
a u = a ∥ ... ∥ a ∥ ... ∥ a (K) (11)
u u u
其中, ||表示连接操作, a (k) 是用户 u 的第 k 层偏好向量, k=0, 1, 2,…, K, a u 为用户 u 的最终嵌入向量.
u
根据上述分析, 输入联合域信息并通过循环 GCN 获得用户 u 的域共享嵌入向量 a , 输入源域/目标域信息获
O
u
a a ; 同样得到项目 O S / T
/
T
S
取对应的源域/目标域特有嵌入向量 u u i 的域共享嵌入向量和域特有嵌入向量 a , a a .
i
i
i
在平衡联合域共性与单域特性的前提下, 为有效地组合用户 u 的共享嵌入向量与特有嵌入向量, 我们分别使
T
S
z
用共享部分参数的门控神经单元生成源域与目标域的组合特征向量 z , (项目 i 在源域与目标域的组合特征向
u u

418 419 420 421 422 423 424 425 426 427 428