Page 234 - 《爆炸与冲击》2026年第5期

P. 234

第 46 卷王继民，等：意外爆炸毁伤知识图谱研究第 5 期

Input layer

火星引爆了空气中的粉尘，爆炸产生了火焰烧毁

Encode layer RoBERTa

GlobalPointer layer GlobalPointer

Event extraction 火星引爆了空气中的粉尘，爆炸产生了火焰烧毁
layer
Explosion source Explosion Damage element
source
Explosion source Explosion
source Damage element
(Detonation event, explosion source, dust)
Output layer (Explosion event, damage element, flame)
(Explosion event, explosion source, dust)
图 2 RoBERTa-GPointer 模型结构
Fig. 2 Structure of RoBERTa-GPointer

（ 2 ）编码层。采用中文预训练模型 R o B E R T a [ 1 4 ] 作为编码层，输入为 Q i n p u t ，然后经过 1 2 层
Transformer 后得到最终的向量表示{h , h , ···, h }。编码具体计算公式：
2
1
n
(2)
h 0 = E i + E p + E s
h α = Trans(h α−1 ) α ∈ [1,12] (3)
式中：h 为初始的向量，E 、E 和 p E 分别表示输入的词嵌入、位置嵌入以及段嵌入向量； h 为输入序列
0
s
α
i
Q t 经过 α 层 Transformer 编码后的向量。
inpu
（3）GlobalPointer 层 [15] 。将输出层学习到的字符向量按其在序列中的次序两两拼接，得到 token-pair
的向量表示，并构建多头 token-pair 关系矩阵，用于处理事件抽取中触发词和论元的重叠问题。
（4）事件抽取层。用于进一步实现事件抽取，包括触发词识别和分类、事件元素检测和识别论元角
色事件信息。
（5）输出层。为事件抽取层解码后的结果，得到模型抽取的触发词、事件类型、论元和论元角色等
信息，将其转为（事件类型、论元角色、论元）的三元组形式，便于之后意外爆炸毁伤知识图谱的构建。
在事件抽取任务中，事件分类和事件元素分类为多目标分类任务，损失函数为：
( ) ( )
∑ ∑
L = lg 1+ e −s j +lg 1+ e s i (4)
j∈A i∈B
式中：A 是正类别集合，B 是负类别集合，s 为类别 i 的得分。
i
1.4 事件共指融合
常出现同一意外爆炸事件被多篇报告描述的情况，为避免信息冗余，并构建更加完整、一致的事件
信息库，需要对抽取出的事件进行共指融合，主要包括基于语义语法相似度的实体对齐和意外爆炸事件
共指融合。
1.4.1 基于语义语法相似度的实体对齐
实体对齐 [16] 是事件共指融合的基础。首先利用 BERT（bidirectional encoder representations from
transformers）模型得到实体在句中的向量表示，计算实体之间的余弦相似度，进而得到两实体的语义相似

051444-5

229 230 231 232 233 234 235 236 237 238 239