Page 234 - 《爆炸与冲击》2026年第5期
P. 234
第 46 卷 王继民,等: 意外爆炸毁伤知识图谱研究 第 5 期
Input layer
火 星 引 爆 了 空 气 中 的 粉 尘 , 爆 炸 产 生 了 火 焰 烧 毁
Encode layer RoBERTa
GlobalPointer layer GlobalPointer
Event extraction 火 星 引 爆 了 空 气 中 的 粉 尘 , 爆 炸 产 生 了 火 焰 烧 毁
layer
Explosion source Explosion Damage element
source
Explosion source Explosion
source Damage element
(Detonation event, explosion source, dust)
Output layer (Explosion event, damage element, flame)
(Explosion event, explosion source, dust)
图 2 RoBERTa-GPointer 模型结构
Fig. 2 Structure of RoBERTa-GPointer
( 2 ) 编 码 层 。 采 用 中 文 预 训 练 模 型 R o B E R T a [ 1 4 ] 作 为 编 码 层 , 输 入 为 Q i n p u t , 然 后 经 过 1 2 层
Transformer 后得到最终的向量表示{h , h , ···, h }。编码具体计算公式:
2
1
n
(2)
h 0 = E i + E p + E s
h α = Trans(h α−1 ) α ∈ [1,12] (3)
式中:h 为初始的向量,E 、E 和 p E 分别表示输入的词嵌入、位置嵌入以及段嵌入向量; h 为输入序列
0
s
α
i
Q t 经过 α 层 Transformer 编码后的向量。
inpu
(3)GlobalPointer 层 [15] 。将输出层学习到的字符向量按其在序列中的次序两两拼接,得到 token-pair
的向量表示,并构建多头 token-pair 关系矩阵,用于处理事件抽取中触发词和论元的重叠问题。
(4)事件抽取层。用于进一步实现事件抽取,包括触发词识别和分类、事件元素检测和识别论元角
色事件信息。
(5)输出层。为事件抽取层解码后的结果,得到模型抽取的触发词、事件类型、论元和论元角色等
信息,将其转为(事件类型、论元角色、论元)的三元组形式,便于之后意外爆炸毁伤知识图谱的构建。
在事件抽取任务中,事件分类和事件元素分类为多目标分类任务,损失函数为:
( ) ( )
∑ ∑
L = lg 1+ e −s j +lg 1+ e s i (4)
j∈A i∈B
式中:A 是正类别集合,B 是负类别集合,s 为类别 i 的得分。
i
1.4 事件共指融合
常出现同一意外爆炸事件被多篇报告描述的情况,为避免信息冗余,并构建更加完整、一致的事件
信息库,需要对抽取出的事件进行共指融合,主要包括基于语义语法相似度的实体对齐和意外爆炸事件
共指融合。
1.4.1 基于语义语法相似度的实体对齐
实体对齐 [16] 是事件共指融合的基础。首先利用 BERT(bidirectional encoder representations from
transformers)模型得到实体在句中的向量表示,计算实体之间的余弦相似度,进而得到两实体的语义相似
051444-5

