Page 190 - 《软件学报》2025年第4期
P. 190

1596                                                       软件学报  2025  年第  36  卷第  4  期



                 操作,    ω 为一组滤波器,   W  为一个可训练的权重矩阵.

                 2.7   训练过程
                    本文将存在于知识图谱中的三元组的标签值设置为                   1, 将不存在于知识图谱中的三元组的标签值设置为                0, 使
                 用的目标函数是二分类交叉熵函数            (binary cross entropy, BCE).

                                                 ∑ N
                                                 |D| ∑
                                                                           d
                                                       d
                                                                   d
                                                            d
                                            L = −     (y log(ˆy )+(1−y )log(1− ˆy ))                 (21)
                                                                           i
                                                                   i
                                                            i
                                                       i
                                                  d  i
                                                                                 d
                 其中,    D 表示知识图谱   G 中事实三元组集合,       N  表示整个数据集中的实体个数,          y ∈ {0,1}  表示第  d  个样本中第  i
                                                                                 i
                                 d      d  个样本的第   个三元组的预测得分.
                 个三元组的标签值,       ˆ y  表示第          i
                                 i
                 3   实验结果

                 3.1   数据集
                                                    [32]
                                                                                            [1]
                                                           [33]
                    本文选取了两个公开的数据集           FB15k-237 和  WN9 . 其中  FB15k-237 数据集来自于  FreeBase , 共包含  14 541
                 个实体和   237  个关系, 该数据集的关系主要有对称关系、非对称关系和组合关系. WN9                    数据集来自于      WordNet ,
                                                                                                       [2]
                 共包含   6 555  个实体和  9  个关系, 该数据集的关系主要有对称关系、非对称关系和反转关系. 在实验中, 如果一个
                 实体只有文本信息而没有图像信息, 本文使用随机向量来初始化图像信息. 数据集类别等具体信息如表                                1  所示.

                                                  表 1 数据集的统计学信息

                             数据集         实体       关系       图像       训练集       验证集       测试集
                            FB15k-237   14 541    237     14 297    272 115   17 535    20 466
                              WN9       6 555      9       6 547    11 741     1 337     1 319

                 3.2   参数设置
                    在实验中, 模型采用      Adam [34] 优化器, 初始学习率设置为     0.001. 另外, 为了防止模型在训练过程中出现过拟合
                 现象, 模型使用    Dropout [35] , 其他一些重要神经网络参数如表     2  所示.
                                                    Hit@K
                                                     表 2 实验参数信息

                                            参数                                 值
                                          Batch size                           128
                                           Dropout                             0.3
                                        RNN网络层数                                 1
                                       RNN网络输出维度                               200
                                        图卷积网络层数                                 1
                                      图卷积网络输出维度                                200

                 3.3   评价指标
                    在测试阶段, 给定一个实体和一个关系, 如果和预测出的实体组成的三元组存在于知识图谱当中, 则预测正
                 确, 反之则预测错误. 本文中的实验性能通过                  [36] 和  MRR [37] 两种指标进行评估. 前者表示预测正确实体的得
                                                  K  的比例. 后者表示所有预测正确实体排名的倒数的均值. 具体计算方
                 分在所有实体的预测得分中的降序排名前
                 式如公式   (22), 公式  (23) 所示:

                                                            |S |
                                                         1  ∑
                                                  Hit@K =     f(rank i ⩽ K)                          (22)
                                                         |S |
                                                            i=1

                                                              |S |
                                                           1  ∑  1
                                                     MRR =                                           (23)
                                                           |S |  rank i
                                                              i=1
                                                             i
                 其中,   |S | 表示数据集中事实三元组的个数,        rank i  表示第   个事实三元组的预测排名.      f (·) 表示如果条件为真则为
   185   186   187   188   189   190   191   192   193   194   195