Page 234 - 《爆炸与冲击》2026年第5期
P. 234

第 46 卷                    王继民,等: 意外爆炸毁伤知识图谱研究                                   第 5 期

                  Input layer

                                 火  星  引   爆  了  空   气  中  的   粉  尘  ,   爆  炸  产   生  了  火   焰  烧  毁

                  Encode layer                                  RoBERTa








               GlobalPointer layer                             GlobalPointer


                Event extraction  火  星  引  爆  了  空  气  中  的   粉   尘  ,   爆   炸  产   生   了   火  焰   烧   毁
                    layer
                                                 Explosion source  Explosion   Damage element
                                                                     source
                                             Explosion source         Explosion
                                                                        source     Damage element
                                                         (Detonation event, explosion source, dust)
                  Output layer                           (Explosion event, damage element, flame)
                                                         (Explosion event, explosion source, dust)
                                                图 2    RoBERTa-GPointer 模型结构
                                               Fig. 2    Structure of RoBERTa-GPointer

                   ( 2 ) 编  码  层  。  采  用  中  文  预  训  练  模  型  R o B E R T a  [ 1 4 ]  作  为  编  码  层  , 输  入  为  Q  i n p u t  , 然  后  经  过  1 2  层
               Transformer 后得到最终的向量表示{h , h , ···, h }。编码具体计算公式:
                                                  2
                                                1
                                                        n
                                                                                                        (2)
                                                      h 0 = E i + E p + E s
                                               h α = Trans(h α−1 )  α ∈ [1,12]                          (3)
               式中:h 为初始的向量,E 、E 和       p   E 分别表示输入的词嵌入、位置嵌入以及段嵌入向量; h 为输入序列
                     0
                                             s
                                                                                               α
                                     i
               Q  t  经过  α  层  Transformer 编码后的向量。
                inpu
                   (3)GlobalPointer 层 [15] 。将输出层学习到的字符向量按其在序列中的次序两两拼接,得到                          token-pair
               的向量表示,并构建多头           token-pair 关系矩阵,用于处理事件抽取中触发词和论元的重叠问题。
                   (4)事件抽取层。用于进一步实现事件抽取,包括触发词识别和分类、事件元素检测和识别论元角
               色事件信息。
                   (5)输出层。为事件抽取层解码后的结果,得到模型抽取的触发词、事件类型、论元和论元角色等
               信息,将其转为(事件类型、论元角色、论元)的三元组形式,便于之后意外爆炸毁伤知识图谱的构建。
                   在事件抽取任务中,事件分类和事件元素分类为多目标分类任务,损失函数为:
                                                  (         )    (        )
                                                      ∑               ∑
                                             L = lg 1+   e −s j  +lg 1+  e  s i                         (4)
                                                       j∈A            i∈B
               式中:A   是正类别集合,B       是负类别集合,s 为类别          i 的得分。
                                                   i
                1.4    事件共指融合
                   常出现同一意外爆炸事件被多篇报告描述的情况,为避免信息冗余,并构建更加完整、一致的事件
               信息库,需要对抽取出的事件进行共指融合,主要包括基于语义语法相似度的实体对齐和意外爆炸事件
               共指融合。
                1.4.1    基于语义语法相似度的实体对齐
                   实体对齐    [16]  是事件共指融合的基础。首先利用               BERT(bidirectional encoder representations from
               transformers)模型得到实体在句中的向量表示,计算实体之间的余弦相似度,进而得到两实体的语义相似



                                                         051444-5
   229   230   231   232   233   234   235   236   237   238   239