Page 267 - 《软件学报》2025年第12期
P. 267

5648                                                      软件学报  2025  年第  36  卷第  12  期


                 或  individual) 集合. 关系  (relation) 集合  R = {r t ,r s }∪R o ∪R d , 其中   r t  表示  rdf : type 关系,  r s  表示  rdfs : subClassOf  关
                 系,  R o  表示对象属性  (object property) 关系集合,  R d  表示数据属性  (data property) 关系集合. 复杂概念可由描述逻辑
                 算子合取   (例如  c i ⊓c j )、析取  (例如  c i ⊔c j )、存在量词  (例如  ∃r.c i ) 和全称量词  (例如  ∀r.c i ) 组合表征.  D 表示数值、
                 文本等数据属性对应的字面量集合,            L 表示概念、实例或属性所对应的标注属性信息                (annotation) 集合. 针对  O  的
                                       c ∈ C、                                      v c ∈ R , v i ∈ R , v r ∈ R , 使其
                                                                                       d
                                                                                             d
                                                                                                   d
                 知识表示学习旨在将所有的                i ∈ I  和  r ∈ R 嵌入为低维稠密特征空间中的向量
                 尽可能地向量化表征       OWL  图谱中各种概念、实例、属性及其公理的语义信息.
                  2.2   整体框架
                    本文所提出的      MSV-KRL  整体框架如图     1  所示. 该方法主要包含了      3  个阶段: 多语义视图划分、语义感知进
                 阶训练、多任务联合表示学习.


                            语义模式层
                                    C                      类层次视图                 (2) 语义感知进阶训练阶段
                    (1)                       F         subClassOf
                    多        D                               subClassOf          {helis: CannedOrCookedFruit,
                    语                    E                D      E           rdfs: subClassOf, helis: SugarAndSweets,
                    义                            视图划分                          rdfs: subClassOf, helis: BasicFood}
                    视                                      类属性视图                         ···
                    图                                    C               多
                    划      literals  d         e            data property  视
                    分                                   object property D  图                标注属性替换
                    阶                                              E     内
                    段               g                      类实例视图         的
                           实例层           literals                        随    {canned or cooked fruit subclassof sugar
                                                        C        D              and sweets subclass of basic food}
                                       解析为RDF图结构         typeOf  typeOf  机               ···
                                                                         游
                                                           c     d
                               ∃r. T  ⊑ A (domain)  ⊔ B (domain);        走
                            复      T  ⊑ r. C (range)    实例对象属性视图         数
                            杂                                            据
                        原生  语                                 object   c  生          自监督进阶训练
                        数据                              object
                   OWL      义     <A, r, C>; <B, r, C>  property  property  成
                    知识  输入  本                                e
                    图谱      体    A  ⊑ □ r. B or  □ r. B  ⊑ A
                            映                           实例数据属性视图                  基于编码器架构的PLMs
                            射        <A, r, B>            c      data   s
                                                           data
                            优                             property property
                            化                                      d
                                      ···               literals
                                                                                            模型支撑
                            多任务学习                          头/尾实体嵌入
                                                                                 (3) 多任务联合表示学习阶段
                                类层级预测
                                                                 ···
                                类属性预测
                                                                          多视图 (helis: Cheese, rdfs: subClassOf, helis: Food)
                  联                                                        输入   (helis: User, helis: consumed, helis: Meal)
                  合   SLAW                    拼接       进阶训练微调后的 PLMs             (helis: Iron_380, rdf: type, helis: Iron)
                  损             类实例预测                        或 LLMs             (helis: FOOD-4009, helis: hasNutrient,
                  失                                                                   helis: Iron_100)
                               实例对象属性                                           (helis: Niacin_220, helis: unit, helis: mg)
                                                                                          ···
                                  预测
                                                                 ···              本体映射后的多语义视图
                               实例数据属性                                                  三元组集合
                                  预测                        关系嵌入


                                                  图 1 MSV-KRL   整体框架

                    在多语义视图划分阶段, MSV-KRL         首先在   OWL2Vec*定义的本体映射策略基础上进行优化, 尤其是针对对
                 象属性的定义域和值域复杂语义约束, 实现              OWL  图谱到   RDF  图结构的更合理解析. 然后, 基于实体多语义空间
   262   263   264   265   266   267   268   269   270   271   272