Page 233 - 《爆炸与冲击》2026年第5期
P. 233
第 46 卷 王继民,等: 意外爆炸毁伤知识图谱研究 第 5 期
应包括压力、距离、加速度、速度、变形以及人员伤亡。
1.1.3 事件定义
将意外爆炸毁伤过程中发生的事件分成 4 类:爆炸事件、引爆事件、反应事件、毁伤事件,事件类型
和触发词示例如表 2 所示。
表 2 意外爆炸毁伤领域中的事件类型、触发词、论元角色和论元
Table 2 Event types, trigger words, ontological roles and ontological elements in accidental explosive damage
事件类型 触发词 论元角色 论元
事件名称 天津大爆炸、清水河大爆炸
时间 凌晨5点30分、2017年8月
地点 工厂、车间
爆炸源 化学制剂类、火药类、粉尘、混合物
爆炸、爆燃、炸、 环境 潮湿、高温、雷击、阵雨、风、封闭
爆炸事件
闪爆、爆裂 TNT当量 1 000 t、0.05 t
次生灾害 二次爆炸、水污染等
毁伤元 冲击波、破片、火焰、深坑等
目标 建筑、设施和人
损失金额 人民币1 000多万元
点燃、引燃、 爆炸源 化学制剂、火药类、粉尘、混合物等
引爆事件
点着、起火、爆燃 点火方式 明火、阴燃、火星、摩擦引热、热表面
爆炸源 化学制剂、火药类、粉尘、混合物等
反应事件 氧化、硝化
产物 氮气、水蒸气、一氧化碳、二氧化碳、氨气
毁伤元 冲击波、破片、火焰、炸坑等
砸毁、冲击、砸、 目标 建筑、设施和人
毁伤事件 震碎、死亡、受伤、 响应程度 飞出100 m、位移7 m
震飞、燃烧 毁伤描述 重度变形、坑深8 m
环境 潮湿、高温、雷击、阵雨、风、封闭
爆炸事件与其他 3 类事件具有一定的因果关系,爆炸事件的触发词可能也是引燃事件的触发词,事
件间触发词存在共享,因此意外爆炸毁伤领域存在事件重叠的情况。
1.2 意外爆炸毁伤语料库构建
利用领域知识对非结构化文本数据进行清洗,剔除异常数据,并进行分词和分句等操作。根据本体
中定义的 13 种一级实体类型对意外爆炸文本进行标注,构建意外爆炸毁伤语料库。其中关系标注采用
人工标注和利用先验知识标注 2 种方式,首先,人工标注单个句子中出现的事件触发词和论元,然后将
人工标注得到的三元组作为先验知识采用远程监督的方式增加标注样本量。经过以上步骤,得到了标
注的意外爆炸毁伤语料库。为方便读取,采用 JSON 格式存储,用于训练、验证和测试抽取模型。
1.3 基于动态掩码的事件联合抽取
在 RoBERTa(robustly optimized bidirectional encoder representations from transformers approach)模型中
加入 GlobalPointer 层形成 RoBERTa-GPointer 模型,来增强对重叠事件和嵌套事件的抽取和识别能力,模
型结构如图 2 所示,主要由输入层、编码层、GlobalPointer 层、事件抽取层和输出层组成。
(1)输入层。将标记的语料传入模型,将标记的触发词、事件类型、论元和论元角色作为关系抽取
任务最终的真实值。模型的输入为中文文本,以字符为单位将待抽取文本切分,得到一个文本序列
Q input ={w ,w ,···,w },其中 w (k=1, 2, 3, ···, n) 是待抽取文本中第 k 个字符。
n
2
1
k
051444-4

