Page 288 - 《软件学报》2025年第12期
P. 288
杨建喜 等: 多语义视图驱动的 OWL 知识图谱表示学习方法 5669
O(1), 它们的影响可以忽略, 若
共的查询时间为 O(n×T s ). 针对条件判断语句而言, 条件分支的时间复杂度是常数
条件满足, 会执行额外的 SPARQL 查询, 用来更新 C domain 或 C range , 假设这些查询的时间仍为 T s , 则更新操作
的时间复杂度为 O(T s ), 可能在某些循环中被触发. 后续双层嵌套循环的时间复杂度为 O(|C domain |×|C range |), 又由于
外层循环对 R o 遍历了 n 次, 总时间复杂度为 O(n×|C domain |×|C range |). 每次添加操作的时间复杂度为 O(1), 然后添
O(n×|C domain |×|C range |). 综上
加操作在双层嵌套循环内执行, 总共执行 n×|C domain |×|C range | 次, 因此其总体复杂度为
所述算法 1 的时间复杂度为 O(n×(T s +|C domain |×|C range |)). 同理对算法 2 进行分析, 可以得出算法 2 的时间复杂度
m s 、 m c 是简单和复杂定义域集合的平均大小, m r 表示定义域集合和
为 O(n×(T s +(m s +m c )+m d ×m r )), 其中 m d 和
简单值域集合的平均大小.
2
MSV-KRL 单个样本嵌入抽取时间, 以及 MSV-KRL、Box EL、OWL2Vec*的单个样本的推理时间消耗如
表 19 中所示. 首先可以发现 MSV-KRL 获取 3 个数据集上单个样本嵌入时间消耗中, FoodOn 的值最大, HeLis 次
之, GO 最小, 这主要是由于 FoodOn 中的实体数量略高于 HeLis, 而 GO 虽然获取嵌入的整体时间消耗要大于
2
FoodOn, 但 GO 中的实体数量要远远大于 FoodOn. 其次, 可以发现 OWL2Vec*和 Box EL 方法在单个样本推理时
间上相差不大, 但 MSV-KRL 却要远大于前两个基线方法. 这主要是由于 MSV-KRL 在进行推理时, 是将所有的概
念或实例都作为候选实体, 而 OWL2Vec*则是经过了筛选. 与此同时, MSV-KRL 通过牺牲一定的时间复杂度, 使
其在多个任务上的性能表现得到了极大的提升.
表 19 HeLis、FoodOn 及 GO 本体所有任务各方法时间复杂度分析
数据集 方法 嵌入抽取时间消耗 (ms) 推理时间消耗 (s)
MSV-KRL 9.6 6.9
2
HeLis Box EL - 1.8
OWL2Vec* - 1.3
MSV-KRL 10.3 12.9
2
FoodOn Box EL - 2.1
OWL2Vec* - 1.4
MSV-KRL 6.3 33.1
2
GO Box EL - 2.3
OWL2Vec* - 1.2
4 总结与展望
本文提出一种新的多语义视图联合 OWL 图谱知识表示学习方法 (MSV-KRL). MSV-KRL 能够通过 OWL 到
RDF 图结构的语义映射优化、概念-属性-实例多视图语义划分以及多语义视图感知的自监督进阶训练表征概念
之间的层级关系信息、多种公理信息、异质属性信息以及标注属性信息, 同时利用面向多语义视图的多任务联合
表示学习加强 OWL 图谱概念层与实例层之间联系. 本文基于多个 OWL 评测数据集开展的多个预测任务对比实
验, 实验结果表明 MSV-KRL 在绝大多数任务上优于当前先进的 OWL 图谱表示学习方法、联合概念层与实例层
的表示学习方法以及针对 OWL 图谱描述逻辑公理的表示学习方法. 同时, 本文通过大量的消融实验、验证性实
验与可视化分析充分证明了 MSV-KRL 各模块的有效性, 以及 MSV-KRL 不受限于语言模型且能够适用于多种类
型的 OWL 图谱.
在未来的工作中将考虑引入时态信息, 面向通用或垂直领域时态知识图谱开展动态知识图谱表示学习. 同时,
鉴于垂直领域知识图谱中存在着多模态信息, 例如存在着部分病害图片与 IB2M 本体中的病害信息相关联, 而本
文方法尚未考虑多模态信息, 将时态与多模态信息融合是未来的知识图谱相关研究中至关重要的一环, 需要进一
步深入研究. 除上述未来工作以外, 本文还将针对 MSV-KRL 的多项不足在未来的研究工作中作出针对性的优化.
首先, 将考虑增强 MSV-KRL 对本体不同复杂程度公理信息的处理能力, 以及针对 OWL 不同子语言的适配能力.
其次, 针对 MSV-KRL 目前无法处理知识图谱中可能存在的语义模糊等数据不一致问题, 以及关系标注错误等

