Page 306 - 《软件学报》2025年第12期
P. 306

张明韬 等: 基于嵌入模型的知识图谱准确性评估                                                         5687



                 这里只展示基于      λ 1  阈值下的  ACC  指标; CAGED  在  NELL-995  上效果远低于其他模型, 不具有参考价值, 因此略
                 去), 结果证明在知识图谱正确率较高的情况下, 利用嵌入模型结合三元组重要性进行评估具有一定可行性.

                               表 6 模型在网络结构加权         w s /关系语义加权  w r 重要性定义下的     ACC 1 指标

                                                 FB15K-237            NELL-995            YAGO3-10
                  模型类型       模型      w选择
                                             90%    80%   60%    90%    80%    60%    90%    80%   60%
                                             0.910  0.856  0.721  0.752  0.711  0.664  0.904  0.840  0.671
                                      w uni
                             TransE    w s   0.910  0.823  0.751  0.746  0.700  0.651  0.921  0.841  0.631
                                       w r   0.901  0.762  0.653  0.657  0.610  0.512  0.890  0.881  0.635
                                             0.910  0.855  0.714  0.694  0.693  0.667  0.902  0.839  0.662
                                      w uni
                  基于平移       TransH    w s   0.903  0.854  0.724  0.695  0.682  0.661  0.918  0.856  0.664
                                             0.879  0.798  0.598  0.648  0.616  0.543  0.876  0.867  0.651
                                       w r
                                             0.926  0.856  0.721  0.761  0.754  0.669  0.896  0.833  0.657
                                      w uni
                             TransD    w s   0.929  0.854  0.755  0.747  0.735  0.653  0.917  0.840  0.652
                                             0.902  0.774  0.710  0.648  0.618  0.520  0.888  0.888  0.654
                                       w r
                                             0.877  0.797  0.644  0.739  0.601  0.569  -     -      -
                                      w uni
                            ComplEx    w s   0.873  0.790  0.653  0.738  0.605  0.584  -     -      -
                                             0.877  0.738  0.526  0.678  0.618  0.507  -     -      -
                                       w r
                                             0.876  0.800  0.643  0.718  0.688  0.561  0.896  0.819  0.660
                                      w uni
                  基于乘法       SimplE    w s   0.879  0.793  0.646  0.722  0.574  0.566  0.872  0.821  0.637
                                             0.866  0.728  0.516  0.673  0.594  0.488  0.868  0.847  0.616
                                       w r
                                             0.877  0.803  0.645  0.719  0.670  0.560  0.881  0.820  0.655
                                      w uni
                            DistMult   w s   0.881  0.802  0.652  0.682  0.667  0.565  0.900  0.810  0.668
                                       w r   0.879  0.759  0.515  0.677  0.575  0.494  0.884  0.846  0.619
                                      w uni  0.917  0.853  0.698  0.635  0.603  0.569  0.896  0.815  0.619
                             RotatE    w s   0.922  0.857  0.706  0.653  0.603  0.572  0.901  0.840  0.610
                                             0.913  0.807  0.573  0.669  0.583  0.528  0.874  0.888  0.576
                                       w r
                                      w uni  0.906  0.861  0.728  0.738  0.738  0.655  -     -      -
                  其他方法       CKRL      w s   0.907  0.868  0.740  0.736  0.722  0.646  -     -      -
                                       w r   0.909  0.844  0.694  0.685  0.626  0.533  -     -      -
                                      w uni  0.904  0.789  0.669  -      -      -     0.892  0.794  0.654
                            CAGED*     w s   0.906  0.690  0.706  -      -      -     0.711  0.623  0.618
                                       w r   0.903  0.703  0.709  -      -      -     0.667  0.584  0.568
                 注: 粗体为基于结构加权或关系语义加权下各数据集对应的最高指标

                    除  NELL-995  外, 数据集表现整体较好, 与表       4  对比可见基于网络结构重要性          w s  的模型接近基于均匀分布
                                                 w r  模型表现略有下降. 说明在只考虑图上的连接关系权重时, 无论是对
                 w uni  模型的性能, 而基于关系语义重要性
                 于  PR  分数较高, 易被访问的三元组, 还是对         PR  分数较低, 重要性较低的三元组, 嵌入模型性能整体结果保持稳
                 定. 而与基于关系语义的加权          w r  对比可见, 其  ACC 1  指标往往低于   w s 和w uni  的对应指标, 平均  ACC 1  整体下降
                 5.3%, 这证明了能够为实体提供独特信息的三元组往往难以被嵌入模型根据统计信息正确判断,                             w r  较高的三元组
                 在嵌入模型的判断过程中可能更容易出现错误. 尽管基于                  w r  加权时嵌入模型自动化评估存在性能下降的风险, 但
                 反之利用   w r  的分布, 也可能筛选出易判断错误的三元组集合, 侧面提升模型的性能.
                    比较  3 个加权方式下不同模型的性能, 可发现: 相对于均匀加权模型性能排名基本保持不变, TransD                        和  CKRL

                 均呈现较好评估结果. 在       w uni  与  w s  权重赋值下, TransD  在最多数据集上表现突出, CKRL   则在  w r  上各数据集中表
                 现突出, 在不考虑     NELL-995  数据集时, TransE  与  TransD  取得各权重赋值下突出的结果, 说明        TransE、TransD、
                 CKRL  等更多关注到    w s 和w r  赋值下较为重要的三元组, 相对其他方法在此类重要性赋值下表现更优.
   301   302   303   304   305   306   307   308   309   310   311