Page 190 - 《软件学报》2025年第4期
P. 190
1596 软件学报 2025 年第 36 卷第 4 期
操作, ω 为一组滤波器, W 为一个可训练的权重矩阵.
2.7 训练过程
本文将存在于知识图谱中的三元组的标签值设置为 1, 将不存在于知识图谱中的三元组的标签值设置为 0, 使
用的目标函数是二分类交叉熵函数 (binary cross entropy, BCE).
∑ N
|D| ∑
d
d
d
d
L = − (y log(ˆy )+(1−y )log(1− ˆy )) (21)
i
i
i
i
d i
d
其中, D 表示知识图谱 G 中事实三元组集合, N 表示整个数据集中的实体个数, y ∈ {0,1} 表示第 d 个样本中第 i
i
d d 个样本的第 个三元组的预测得分.
个三元组的标签值, ˆ y 表示第 i
i
3 实验结果
3.1 数据集
[32]
[1]
[33]
本文选取了两个公开的数据集 FB15k-237 和 WN9 . 其中 FB15k-237 数据集来自于 FreeBase , 共包含 14 541
个实体和 237 个关系, 该数据集的关系主要有对称关系、非对称关系和组合关系. WN9 数据集来自于 WordNet ,
[2]
共包含 6 555 个实体和 9 个关系, 该数据集的关系主要有对称关系、非对称关系和反转关系. 在实验中, 如果一个
实体只有文本信息而没有图像信息, 本文使用随机向量来初始化图像信息. 数据集类别等具体信息如表 1 所示.
表 1 数据集的统计学信息
数据集 实体 关系 图像 训练集 验证集 测试集
FB15k-237 14 541 237 14 297 272 115 17 535 20 466
WN9 6 555 9 6 547 11 741 1 337 1 319
3.2 参数设置
在实验中, 模型采用 Adam [34] 优化器, 初始学习率设置为 0.001. 另外, 为了防止模型在训练过程中出现过拟合
现象, 模型使用 Dropout [35] , 其他一些重要神经网络参数如表 2 所示.
Hit@K
表 2 实验参数信息
参数 值
Batch size 128
Dropout 0.3
RNN网络层数 1
RNN网络输出维度 200
图卷积网络层数 1
图卷积网络输出维度 200
3.3 评价指标
在测试阶段, 给定一个实体和一个关系, 如果和预测出的实体组成的三元组存在于知识图谱当中, 则预测正
确, 反之则预测错误. 本文中的实验性能通过 [36] 和 MRR [37] 两种指标进行评估. 前者表示预测正确实体的得
K 的比例. 后者表示所有预测正确实体排名的倒数的均值. 具体计算方
分在所有实体的预测得分中的降序排名前
式如公式 (22), 公式 (23) 所示:
|S |
1 ∑
Hit@K = f(rank i ⩽ K) (22)
|S |
i=1
|S |
1 ∑ 1
MRR = (23)
|S | rank i
i=1
i
其中, |S | 表示数据集中事实三元组的个数, rank i 表示第 个事实三元组的预测排名. f (·) 表示如果条件为真则为