Page 272 - 《软件学报》2025年第12期
P. 272

杨建喜 等: 多语义视图驱动的        OWL  知识图谱表示学习方法                                          5653



                                                   T s = {(c m ,r s ,c n ) | c m ,c n ∈ C}            (9)

                                                   T t = {(i,r t ,c) | i ∈ I,c ∈ C}                  (10)

                                               T c = {(c d ,r p ,c r ) | c d ,c r ∈ C,r p ∈ R o ∪R d }  (11)

                                                 T o = {(i m ,r o ,i n ) | i m ,i n ∈ I,r o ∈ R o }  (12)

                                               T d = {(i m ,r d ,d n ) | i m ∈ I,r d ∈ R d ,d n ∈ D}  (13)
                 其中,   r s  表示  rdfs : subClassOf  关系,  r t  表示  rdf : type 关系,  r p  表示对象属性或数据属性关系,  r o  为对象属性,  r d  为
                 数据属性. 因此,    T s  存储了  RDF  图谱  G  中所有的类之间层级语义声明三元组集合,          T t  为实例与类之间的类型定义
                 语义声明三元组集合,       T c  为定义域、对象属性或数据属性、值域的语义关联三元组集合,                   T o  中为实例、对象属性
                 和实例的语义关联三元组集合,           T d  为实例、数据属性和字面量信息语义关联的三元组集合. 表                 2  中描述了  HeLis
                 本体划分生成的各语义视图          RDF  三元组示例.

                                                表 2 HeLis 多语义视图划分示例

                        语义视图名称                                  各视图中RDF三元组示例
                                                     ⟨helis : Beer,rdfs : subClassOf,helis : AlcoholicBeverages⟩
                      类层级关系视图     T s                   ⟨helis : Eggs,rdfs : subClassOf,helis : BasicFood⟩
                                                        ⟨helis : Meat,rdfs : subClassOf,helis : BasicFood⟩
                                                          ⟨helis : FOOD-4001,rdfs : type,helis : Beer⟩
                      类实例关系视图     T t                ⟨helis : AsparticAcid_800,rdfs : type,helis : AsparticAcid⟩
                                                        ⟨helis : VitaminD_046,rdfs : type,helis : Nutrient⟩
                                                       ⟨helis : Beer,helis : hasNutrient,helis : AsparticAcid⟩
                      类属性关系视图     T c                ⟨helis : AsparticAcid,helis : amountOfNutrient, xsd : double⟩
                                                      ⟨helis : ComposedFood,helis : contains,helis : Dressing⟩
                                                   ⟨helis : FOOD-4001,helis : hasNutrient,helis : AsparticAcid_800⟩
                     实例对象属性视图     T o        ⟨helis : RECIPE-388-200,helis : hasRecipeFood,helis : RECIPEFOOD-FOOD-200⟩
                                                ⟨helis : RECIPEFOOD-FOOD-1204,helis : hasFood,helis : FOOD-1204⟩
                                                     ⟨helis : AsparticAcid_800,helis : amountOfNutrient,“8.0”⟩
                     实例数据属性视图     T d                  ⟨helis : FOOD-1505,helis : amountEnergy,“833.0”⟩
                                                            ⟨helis : Niacin_220,helis : unit,“mg”⟩

                    例如, 表  2  中示例的  helis : FOOD-4001 的类型是  helis : Beer. 类属性关系包含了类对象属性关系与类数据属
                 性关系, 例如表    2  中类属性关系视图类别第        1  个三元组是类对象属性, 第      2  个三元组是类数据属性. 实例对象属性
                 是指头实体和尾实体是实例, 关系是对象属性. 而实例数据属性的关系是数据属性, 尾实体是字面量, 字面量可以
                 是包括字符串、浮点型和整型等在内的多种数据类型. 在                   5  个子视图中, 类层级关系视图与类实例关系视图仅包
                 含一种关系, 而其余      3  种视图包含了对象属性和数据属性中的一类关系, 因此本文将前两个视图称为单关系视图,
                 将后  3  个视图称为多关系视图.
                  2.4   多语义视图感知的   PLMs 自监督进阶训练
                    为提升通用     PLMs 的多语义视图上下文特征编码能力, 需要在该场景下开展进阶训练并微调模型参数. 因此,
                 本文首先提出了面向多语义视图的序列化数据生成策略, 并在其基础上开展                         PLMs 自监督进阶训练.
                  2.4.1    面向多语义视图的三元组数据序列化策略
                    第  1  阶段划分生成的多语义视图是由若干三元组构成的                 RDF  图结构信息, 为使其适应于主流         PLMs 的文本
                 序列化编码机制, 需将其按照特定的语义模式转换为序列化结构. 与                    OWL2Vec*等方法在整个       RDF  图结构上随机
                 游走生成文本序列不同, 本文面向多语义视图上下文特点, 采用单一视图内游走策略, 以实现在编码阶段加强模型
                 的视图内语义上下文理解能力. 在三元组数据序列化转换过程中, 本文将三元组中的谓语也作为图节点, 根据不同
                 视图的语义特点分别设计序列化策略.
   267   268   269   270   271   272   273   274   275   276   277