Page 288 - 《软件学报》2025年第12期
P. 288

杨建喜 等: 多语义视图驱动的        OWL  知识图谱表示学习方法                                          5669


                                                                                 O(1), 它们的影响可以忽略, 若
                 共的查询时间为      O(n×T s ). 针对条件判断语句而言, 条件分支的时间复杂度是常数
                 条件满足, 会执行额外的        SPARQL  查询, 用来更新     C domain  或  C range , 假设这些查询的时间仍为  T s , 则更新操作
                 的时间复杂度为      O(T s ), 可能在某些循环中被触发. 后续双层嵌套循环的时间复杂度为                 O(|C domain |×|C range |), 又由于
                 外层循环对    R o  遍历了  n  次, 总时间复杂度为   O(n×|C domain |×|C range |). 每次添加操作的时间复杂度为  O(1), 然后添
                                                                                   O(n×|C domain |×|C range |). 综上
                 加操作在双层嵌套循环内执行, 总共执行             n×|C domain |×|C range | 次, 因此其总体复杂度为
                 所述算法    1  的时间复杂度为    O(n×(T s +|C domain |×|C range |)). 同理对算法  2  进行分析, 可以得出算法  2  的时间复杂度
                                               m s 、 m c  是简单和复杂定义域集合的平均大小,             m r  表示定义域集合和
                 为   O(n×(T s +(m s +m c )+m d ×m r )), 其中                         m d  和
                 简单值域集合的平均大小.
                                                                  2
                    MSV-KRL  单个样本嵌入抽取时间, 以及          MSV-KRL、Box EL、OWL2Vec*的单个样本的推理时间消耗如
                 表  19  中所示. 首先可以发现    MSV-KRL  获取  3  个数据集上单个样本嵌入时间消耗中, FoodOn          的值最大, HeLis 次
                 之, GO  最小, 这主要是由于     FoodOn  中的实体数量略高于       HeLis, 而  GO  虽然获取嵌入的整体时间消耗要大于
                                                                                   2
                 FoodOn, 但  GO  中的实体数量要远远大于      FoodOn. 其次, 可以发现    OWL2Vec*和  Box EL  方法在单个样本推理时
                 间上相差不大, 但     MSV-KRL  却要远大于前两个基线方法. 这主要是由于             MSV-KRL  在进行推理时, 是将所有的概
                 念或实例都作为候选实体, 而         OWL2Vec*则是经过了筛选. 与此同时, MSV-KRL          通过牺牲一定的时间复杂度, 使
                 其在多个任务上的性能表现得到了极大的提升.

                                  表 19 HeLis、FoodOn  及  GO  本体所有任务各方法时间复杂度分析

                              数据集             方法          嵌入抽取时间消耗 (ms)         推理时间消耗 (s)
                                            MSV-KRL              9.6                 6.9
                                               2
                              HeLis          Box EL              -                   1.8
                                           OWL2Vec*              -                   1.3
                                            MSV-KRL              10.3                12.9
                                               2
                              FoodOn         Box EL              -                   2.1
                                           OWL2Vec*              -                   1.4
                                            MSV-KRL              6.3                 33.1
                                               2
                               GO            Box EL              -                   2.3
                                           OWL2Vec*              -                   1.2

                  4   总结与展望

                    本文提出一种新的多语义视图联合             OWL  图谱知识表示学习方法        (MSV-KRL). MSV-KRL  能够通过   OWL  到
                 RDF  图结构的语义映射优化、概念-属性-实例多视图语义划分以及多语义视图感知的自监督进阶训练表征概念
                 之间的层级关系信息、多种公理信息、异质属性信息以及标注属性信息, 同时利用面向多语义视图的多任务联合
                 表示学习加强     OWL  图谱概念层与实例层之间联系. 本文基于多个               OWL  评测数据集开展的多个预测任务对比实
                 验, 实验结果表明     MSV-KRL  在绝大多数任务上优于当前先进的            OWL  图谱表示学习方法、联合概念层与实例层
                 的表示学习方法以及针对         OWL  图谱描述逻辑公理的表示学习方法. 同时, 本文通过大量的消融实验、验证性实
                 验与可视化分析充分证明了          MSV-KRL  各模块的有效性, 以及      MSV-KRL  不受限于语言模型且能够适用于多种类
                 型的  OWL  图谱.
                    在未来的工作中将考虑引入时态信息, 面向通用或垂直领域时态知识图谱开展动态知识图谱表示学习. 同时,
                 鉴于垂直领域知识图谱中存在着多模态信息, 例如存在着部分病害图片与                         IB2M  本体中的病害信息相关联, 而本
                 文方法尚未考虑多模态信息, 将时态与多模态信息融合是未来的知识图谱相关研究中至关重要的一环, 需要进一
                 步深入研究. 除上述未来工作以外, 本文还将针对              MSV-KRL  的多项不足在未来的研究工作中作出针对性的优化.
                 首先, 将考虑增强     MSV-KRL  对本体不同复杂程度公理信息的处理能力, 以及针对                 OWL  不同子语言的适配能力.
                 其次, 针对   MSV-KRL  目前无法处理知识图谱中可能存在的语义模糊等数据不一致问题, 以及关系标注错误等
   283   284   285   286   287   288   289   290   291   292   293