Page 276 - 《软件学报》2025年第12期
P. 276

杨建喜 等: 多语义视图驱动的        OWL  知识图谱表示学习方法                                          5657


                    联合损失函数采用加权相加的方式计算多任务联合损失值, 如公式                      (40) 所示, 其中  L joint  表示多任务联合损失
                 值,  w t 、 w s 、 w c 、 w d  以及  w o  分别表示任务  、 、 、 T d  以及  T o  对应损失函数的权重值.
                                                     T s
                                                  T t
                                                         T c

                                                  t      s     c      o      d
                                          L joint = w t L BCE  +w s L BCE  +w c L BCE  +w o L BCE  +w d L BCE  (40)
                    公式  (40) 中的各个任务对应权重值通过          SLAW (scaled loss approximate weighting) 算法  [61] 依据模型训练过程
                 中各任务损失值变化自动进行更新, 如公式              (41)–公式  (44) 所示.

                                                                   2
                                                     a i ← βa i +(1−β)L                              (41)
                                                                   i
                                                                                                     (42)
                                                     b i ← βb i +(1−β)L i

                                                           √
                                                        s i ←  a i −b 2                              (43)
                                                                 i
                                                              n
                                                             /∑
                                                     w i = (n/s i )  (1/s j )                        (44)
                                                              j=1
                 其中,  β 为超参数, 在模型开始训练前定义,         L i  表示第  i 个任务损失值,  a i  与  b i  的值在模型开始训练前自定义值进行
                                                             j
                 初始化,  n = 5 表示任务数量,   s i  与   s j  分别表示第  i 个和第   个任务损失值的估计标准差.
                  3   实验分析
                  3.1   数据集与实验设置
                  3.1.1    数据集
                    参照  OWL2Vec*  [26] 的实验数据集选择, 本文首先在      HeLis [14] 、FoodOn [15] 以及  GO [16] 这  3  个  OWL  语义图谱上
                 针对类实例预测、类层级关系预测和类属性预测等多个任务展开对比实验. 表                           4  描述了实验相关数据集的统计
                 信息.

                                   表 4 HeLis、FoodOn、GO、IB2M    及  DBpedia-20k  相关统计信息

                    OWL图谱       实例       类      实例对象属性        实例数据属性         公理      类实例      类层级关系
                     HeLis      20 318   277       83 210        39 808     172 213   20 318     261
                     FoodOn      359    28 182       0             0        241 581    0        29 778
                      GO         0      44 244       0             0        513 306    0        72 601
                   DBpedia-20k  19 996  1 227        0             0        71 692    20 001     813
                     IB2M       22 427   245       36 466        14 739     120 346   22 435     348
                 注: “实例对象属性”表示实例间对象属性声明的数量, “实例数据属性”表示实例间数据属性声明的数量, 其余各列表示其本身在
                 OWL图谱中的数量

                    为了进一步验证本文所提方法面向不同领域知识图谱的表示学习性能, 本文在                           DBpedia 和  IB2M  两个  OWL
                 语义图谱上展开实验. 其中, DBpedia      [13] 来自于  WikiPedia, 包含了大量通用世界知识. DBpedia 有超过    40  万个实例,
                 也包含了   OWL  概念层语义定义. 本文从       DBpedia 实例层中随机抽取      20 000  实例, 将其与概念层进行融合, 合并为
                 一个完整的    OWL  图谱, 在后续实验中将该       OWL  图谱称为    DBpedia-20k. IB2M (intelligent bridge management and
                 maintenance) [62] 是在  BSHM (bridge structure and health monitoring) [63]  OWL  语义基础上构建的桥梁智能管养领域知
                 识图谱, 表征了桥梁结构体系、材料属性、健康监测、结构检测和养护等多维度语义信息. IB2M                              图谱也被应用
                 于知识图谱问答任务       [4] . 图  2  描述了  IB2M  知识图谱中的部分概念、实例及其语义关系.
                    从表  4  中各  OWL  图谱的各项指标参数可以发现, HeLis 和         IB2M  中包含了  5  种预测任务所需要的全部公理
                 信息. 而  FoodOn  和  GO  中对应的类实例关系、实例对象属性关系与实例数据属性关系数量为                     0, 表示只包含了两
                 种任务公理信息. 同时, DBpedia-20k    的概念层和实例层分别属于两个文件, 且实例文件中仅包含了实例的类型信
                 息, 尚未定义实例对象属性关系和实例数据属性关系. 综合分析其统计结果, 上述                       5 种数据集反映了不同领域        OWL
                 语义图谱的差异化上下文场景, 可为本文提出方法在不同                   OWL  语义知识表示学习性能评估提供支持. 本文实验
                 所采用的上述数据集及相关代码可在下列地址获取: https://github.com/Institute-of-BDKE-CQJTU/MSV-KRL.
   271   272   273   274   275   276   277   278   279   280   281