Page 231 - 《爆炸与冲击》2026年第5期
P. 231
第 46 卷 王继民,等: 意外爆炸毁伤知识图谱研究 第 5 期
随着国家基础建设的发展,易燃易爆品的生产、运输和使用也更加频繁,在促进经济、社会发展的
同时,意外爆炸事故也随之增多 [1-2] 。意外爆炸往往具有爆炸威力大、爆源物资种类多、事故现场复杂等
特点,使得依赖传统科研“三范式”(理论分析、试验研究和数值仿真)的方式难以满足爆炸事故分析的
复杂需求。随着机器学习技术的发展和领域数据的积累,使得“数据驱动”的研究范式成为可能,即通
过收集、分析和挖掘数据,揭示隐藏的规律。意外爆炸事故调查数据是该领域最常用、信息容量最大的
数据,但这些数据往往具有多源、异构和重复等特征,评估数据驱动的毁伤效果十分困难。
知识图谱是一种语义网络,为知识提供了一个结构化的表达形式,可以高效地发掘事物间的复杂关联
[5]
信息 [3-4] 。知识图谱非常适用于信息查询和推理,被广泛应用于信息检索、智能问答、推荐系统 以及垂直
[6]
领域 。通过从大量意外爆炸毁伤资料中抽取出实体关系三元组,并建立意外爆炸毁伤知识图谱,有利于
将分散的、难以利用的意外爆炸数据有效组织起来,构建出精简的、统一视角的意外爆炸毁伤信息库,
对意外爆炸的评估以及溯源具有重要作用。刘宝等 [7] 基于循环神经网络(recurrent neural network,RNNs)
技术,抽取化学品的实体与关系,构建了危险评估知识图谱,提升了评估人员获取相关知识和质检信息
的效率。李聪等 [8] 基于燃气管泄漏事故建立燃气管网知识图谱,研究人员、管道缺陷、管理之间的关系,
并且根据管道缺陷的信息预测了防腐缺陷的类型。何允 [9] 构建了化工事故原因知识图谱,围绕爆炸、中
毒、泄漏、火灾等事故,分析了人员行为、企业决策和物品状态等因素,建立了完整的原因分类体系。
目前中文领域尚未建立成熟的意外爆炸毁伤知识图谱,相关研究工作都没有深入研究意外爆炸的
爆炸源、毁伤元以及对目标的毁伤效应等,尚无法支撑对意外爆炸事故的毁伤评估。意外爆炸毁伤领域
除爆炸事件外,还存在包括引燃、毁伤事件等其他类型的事件,这些事件构成了嵌套和重叠事件。根据
本文作者的统计,54% 的意外爆炸事件中存在嵌套事件,32% 的事件中存在重叠事件,如表 1 所示,这使
得触发词抽取和事件类型检测结果存在误差,影响了事件的最终抽取效果。
表 1 意外爆炸毁伤事件嵌套和重叠示例
Table 1 Examples of nested and overlapping events in accidental explosion damage
问题 事例 说明
重叠事件 爆炸导致小轿车燃烧 事件类型:爆炸事件、毁伤事件
嵌套事件 爆炸抛出的碎石砸毁了附近的房屋 事件类型:爆炸事件、毁伤事件
针对意外爆炸毁伤效应文本资料的特点,本文提出构建意外爆炸毁伤知识图谱的方法,并开展意外
爆炸事故溯源的下游应用分析:首先,针对意外爆炸非结构化文本资料的特点,提出集成半自动本体构
建、基于动态掩码的中文事件联合抽取以及事件共指融合等算法的知识图谱构建方法,并将其与现有抽
取模型进行实验对比;然后,基于意外爆炸毁伤知识图谱,对其中的爆炸源、毁伤元、毁伤效应等之间的
关联和规律进行挖掘和分析,实现爆炸溯源。
1 意外爆炸毁伤知识图谱构建
意外爆炸毁伤知识图谱(accidental explosion damage knowledge graph,AEDKG)构建流程如图 1 所
示,主要包括 4 个步骤:意外爆炸毁伤领域本体的半自动构建、意外爆炸毁伤语料库的构建、基于动态掩
码的中文事件联合抽取以及事件共指融合。
1.1 意外爆炸毁伤领域半自动本体构建
本体是共享概念的模型明确的形式化规范说明 [10] ,是构建知识图谱的“蓝图”,主要用于定义知识
图谱的概念/类、关系/属性和约束等。传统的本体构建方法主要采用人工方式自顶向下的方法,过
分依赖构建者所掌握的专家知识,缺乏对本领域文本中概念的分析和归纳。本文提出基于 TextRank [11]
和 K-Means [12] 的半自动本体构建法,以提高意外爆炸领域本体构建工作的效率和质量。半自动本体构
建过程包括:确定本体范围与复用评估、基于聚类的领域本体提取以及事件定义 3 个步骤。
051444-2

