Page 272 - 《软件学报》2025年第12期
P. 272
杨建喜 等: 多语义视图驱动的 OWL 知识图谱表示学习方法 5653
T s = {(c m ,r s ,c n ) | c m ,c n ∈ C} (9)
T t = {(i,r t ,c) | i ∈ I,c ∈ C} (10)
T c = {(c d ,r p ,c r ) | c d ,c r ∈ C,r p ∈ R o ∪R d } (11)
T o = {(i m ,r o ,i n ) | i m ,i n ∈ I,r o ∈ R o } (12)
T d = {(i m ,r d ,d n ) | i m ∈ I,r d ∈ R d ,d n ∈ D} (13)
其中, r s 表示 rdfs : subClassOf 关系, r t 表示 rdf : type 关系, r p 表示对象属性或数据属性关系, r o 为对象属性, r d 为
数据属性. 因此, T s 存储了 RDF 图谱 G 中所有的类之间层级语义声明三元组集合, T t 为实例与类之间的类型定义
语义声明三元组集合, T c 为定义域、对象属性或数据属性、值域的语义关联三元组集合, T o 中为实例、对象属性
和实例的语义关联三元组集合, T d 为实例、数据属性和字面量信息语义关联的三元组集合. 表 2 中描述了 HeLis
本体划分生成的各语义视图 RDF 三元组示例.
表 2 HeLis 多语义视图划分示例
语义视图名称 各视图中RDF三元组示例
⟨helis : Beer,rdfs : subClassOf,helis : AlcoholicBeverages⟩
类层级关系视图 T s ⟨helis : Eggs,rdfs : subClassOf,helis : BasicFood⟩
⟨helis : Meat,rdfs : subClassOf,helis : BasicFood⟩
⟨helis : FOOD-4001,rdfs : type,helis : Beer⟩
类实例关系视图 T t ⟨helis : AsparticAcid_800,rdfs : type,helis : AsparticAcid⟩
⟨helis : VitaminD_046,rdfs : type,helis : Nutrient⟩
⟨helis : Beer,helis : hasNutrient,helis : AsparticAcid⟩
类属性关系视图 T c ⟨helis : AsparticAcid,helis : amountOfNutrient, xsd : double⟩
⟨helis : ComposedFood,helis : contains,helis : Dressing⟩
⟨helis : FOOD-4001,helis : hasNutrient,helis : AsparticAcid_800⟩
实例对象属性视图 T o ⟨helis : RECIPE-388-200,helis : hasRecipeFood,helis : RECIPEFOOD-FOOD-200⟩
⟨helis : RECIPEFOOD-FOOD-1204,helis : hasFood,helis : FOOD-1204⟩
⟨helis : AsparticAcid_800,helis : amountOfNutrient,“8.0”⟩
实例数据属性视图 T d ⟨helis : FOOD-1505,helis : amountEnergy,“833.0”⟩
⟨helis : Niacin_220,helis : unit,“mg”⟩
例如, 表 2 中示例的 helis : FOOD-4001 的类型是 helis : Beer. 类属性关系包含了类对象属性关系与类数据属
性关系, 例如表 2 中类属性关系视图类别第 1 个三元组是类对象属性, 第 2 个三元组是类数据属性. 实例对象属性
是指头实体和尾实体是实例, 关系是对象属性. 而实例数据属性的关系是数据属性, 尾实体是字面量, 字面量可以
是包括字符串、浮点型和整型等在内的多种数据类型. 在 5 个子视图中, 类层级关系视图与类实例关系视图仅包
含一种关系, 而其余 3 种视图包含了对象属性和数据属性中的一类关系, 因此本文将前两个视图称为单关系视图,
将后 3 个视图称为多关系视图.
2.4 多语义视图感知的 PLMs 自监督进阶训练
为提升通用 PLMs 的多语义视图上下文特征编码能力, 需要在该场景下开展进阶训练并微调模型参数. 因此,
本文首先提出了面向多语义视图的序列化数据生成策略, 并在其基础上开展 PLMs 自监督进阶训练.
2.4.1 面向多语义视图的三元组数据序列化策略
第 1 阶段划分生成的多语义视图是由若干三元组构成的 RDF 图结构信息, 为使其适应于主流 PLMs 的文本
序列化编码机制, 需将其按照特定的语义模式转换为序列化结构. 与 OWL2Vec*等方法在整个 RDF 图结构上随机
游走生成文本序列不同, 本文面向多语义视图上下文特点, 采用单一视图内游走策略, 以实现在编码阶段加强模型
的视图内语义上下文理解能力. 在三元组数据序列化转换过程中, 本文将三元组中的谓语也作为图节点, 根据不同
视图的语义特点分别设计序列化策略.

