Page 280 - 《软件学报》2025年第12期

P. 280

杨建喜等: 多语义视图驱动的 OWL 知识图谱表示学习方法 5661

2
2
FoodOn 上略弱于 Box EL 方法. 然而, 当 Box EL 遇到更加复杂的 OWL 图谱如 GO 时, 却难以充分捕获更加复杂
的概念之间的公理信息. DGS 方法虽无法处理类属性关系, 本文仍将其作为概念层部分同实例部分一起进行训练
测试, 通过结果可以发现, 该方法能够通过双曲空间学习到多关系信息. 但是, 由于 DGS 无法使用文本信息, 也没
2
有深度利用前面所述公理信息, 因此其性能相比于 Box EL 和 MSV-KRL 仍有待提升. RDF2Vec 方法在单独处理
简单 OWL 图谱时, 效果要优于 Onto2Vec 和 OPA2Vec, 但难以处理 GO 等复杂图谱. 同时, 由于 OPA2Vec 加入了
文本信息, 因此其表现整体要好于 Onto2Vec. 而 OWL2Vec*在上述几种方法基础上能够充分捕获多种公理信息,
所以其效果整体上要优于其他 3 种方法, 但 OWL2Vec*仍不能有效处理所有类属性信息.

表 8 HeLis、FoodOn 及 GO 类属性预测任务实验结果

HeLis FoodOn GO
方法
MRR H@1 H@5 H@10 MRR H@1 H@5 H@10 MRR H@1 H@5 H@10
Onto2Vec [56] 0.145 0.098 0.166 0.217 0.044 0.014 0.061 0.101 0.011 0.003 0.017 0.025
OPA2Vec [57] 0.147 0.111 0.167 0.195 0.046 0.013 0.064 0.112 0.034 0.013 0.045 0.072
RDF2Vec [64] 0.218 0.083 0.333 0.500 0.069 0.032 0.096 0.148 0.014 0.005 0.019 0.031
OWL2Vec* [26] 0.139 0.083 0.167 0.250 0.088 0.039 0.121 0.185 0.021 0.007 0.028 0.040
[51]
DGS 0.083 0.250 0.250 0.250 －－－－－－－－
2 [23]
Box EL 0.272 0.083 0.417 0.667 0.437 0.398 0.466 0.501 0.363 0.282 0.451 0.499
MSV-KRL 0.396 0.333 0.500 0.583 0.354 0.256 0.465 0.548 0.421 0.301 0.554 0.657

3.2.4 实例对象属性预测任务
HeLis 实例对象属性预测任务实验结果如表 9 所示. 从实验结果可知, MSV-KRL 性能表现远超所有基线方
法, 在 MRR 指标上相比次优方法 DGS 提升了约 465.9%, 证明 MSV-KRL 相比于 DGS 等方法更加擅长处理实例
层信息. 此外, DGS 方法的表现整体上要优于其他基线方法, 其原因是 DGS 训练时联合 OWL 图谱概念层与实例
层信息, 能够充分利用实例的类型信息. 虽然本文将整个 OWL 图谱用于训练 Box EL, 并使用实例对象属性三元
2
2
组测试得到了结果, 但可以发现 Box EL 仅适用于学习 OWL 图谱概念层公理信息. 在其余 4 种基线方法中 OWL2Vec*
取得的效果最好, 其原因是 OWL2Vec*能够较好地处理类实例关系和类层级关系. 而 Onto2Vec 和 OPA2Vec 由于
利用了 OWL 图谱中的所有信息, 因此性能表现要优于仅使用当前任务数据集的 RDF2Vec 方法.

表 9 HeLis 实例对象属性预测任务实验结果

方法 MRR H@1 H@5 H@10
[56]
Onto2Vec 0.027 0.006 0.027 0.057
[57]
OPA2Vec 0.027 0.005 0.028 0.057
[64]
RDF2Vec 0.023 0.004 0.023 0.045
[26]
OWL2Vec* 0.029 0.007 0.029 0.056
[51]
DGS 0.047 0.000 0.099 0.206
2 [23]
Box EL 0.004 0.002 0.004 0.005
MSV-KRL 0.266 0.206 0.316 0.377

3.2.5 实例数据属性预测任务
HeLis 实例数据属性预测任务实验结果如表 10 所示, 得益于 MSV-KRL 能够充分利用 OWL 图谱中的标注属
性信息与类数据属性信息, 同时利用面向多语义视图的多任务联合表示学习加强两者之间的联系, 其在所有指标
2
上均取得了最佳性能. 除 MSV-KRL 方法外, 其他方法均在该任务上表现较差, 具体分析而言, Box EL 难以处理
ABox 部分信息, 性能表现有待提升. 此外, 数据属性三元组中尾实体多是由文本或数字构成的字面量, OWL2Vec*、
RDF2Vec 和 OPA2Vec 方法虽然能够处理这类文本信息, 但却都无法与字面量的类型信息建立联系, 造成其在该
任务上的表现仍然欠佳.

275 276 277 278 279 280 281 282 283 284 285