Page 232 - 《爆炸与冲击》2026年第5期
P. 232
第 46 卷 王继民,等: 意外爆炸毁伤知识图谱研究 第 5 期
Semi-Automatic Determine ontology scope and reuse Training RoBERTazh-GPLinker Joint extraction
construction of assessment of Chinese events
accidental explosion based on dynamic
damage ontology Event joint eXtraction with masking
Domain ontology extraction based
on clustering RoBERTazh-GPLinker
Definition of accidental explosion
event Event set
Construction of an
accidental explosion Accidental explosion domain
damage corpus ontology, event definition Translation to triples
Accidental explosion Manual annotation
text Event coreference
Entity alignment based on semantics and syntax resolution
Prior
knowledge
Remote supervision
annotation
Accidental explosion damage
Annotated corpus of knowledge graph
accidental explosions
Data flow Business flow
图 1 意外爆炸毁伤知识图谱构建流程
Fig. 1 Construction process of knowledge graph for accidental explosion damage
1.1.1 确定本体范围与复用评估
本体构建聚焦于意外爆炸毁伤领域,研究内容涵盖爆炸源的起爆方式、毁伤元的形成与作用过程。
由于意外爆炸毁伤领域的知识图谱研究尚属空白,现有军事、化工等相近领域的本体在术语体系与研究
重点上差异较大,难以满足本研究需求,因此不能复用现有本体,需从头构建领域专属本体结构。
1.1.2 基于聚类的领域本体提取
为了全面提取意外爆炸毁伤领域的核心术语,采用 3 种方式进行关键词收集。(1)从权威机构或出
版社发布的专业调查报告、工具书或标准文件中的术语附录中收集;(2)采用聚类算法从领域文本中自
动筛选关键词;(3)由领域专家对自动提取与聚类结果进行补充,完善遗漏的重要术语。
采用聚类从意外爆炸毁伤领域文本中自动提取关键词包括 2 个步骤。
第 1 步,在预处理的语料上使用 TextRank 算法计算出关键词的得分。假设语料库有词语集合 V,
V 表示第 i 个词,根据下式计算每个词语的重要性得分。
i
∑ k ji ( )
Z (V i ) = 1−d +d ∑ Z V j (1)
V j ∈I(V i ) k jk
V k ∈O( V j)
式中:Z(V ) 为词语 V 的重要性得分;d 为阻尼系数,通常设为 0.85;I(V ) 表示指向节点 V 的所有词语;
i
i
i i
O(V ) 表示 V 出发指向的所有词语集合;k 为节点 V 到 j V 的边权重,默认为 1。使用 Word2vec [13] 将这些
j
i
i
j
j
关键词转为语义向量,对向量使用 K-Means 方法进行聚类。
第 2 步,利用专家知识拆分、合并得到的关键词聚类结果,抽象出本体的层级。最终将意外爆炸本
体分为爆炸事件、毁伤元、爆炸源、环境、目标种类、起爆方式、点火方式、爆炸当量、目标响应、次生灾
害、国际规范、爆炸产物和反应过程等 13 个一级分类。进一步根据专家知识在此基础上划分二级本体,
其中毁伤元包括冲击波、破片、燃烧、成坑、地冲击以及震动;目标种类包括建筑、设施以及人;目标响
051444-3

