Page 144 - 《武汉大学学报(信息科学版)》2025年第6期
P. 144
1166 武 汉 大 学 学 报 (信 息 科 学 版) 2025 年 6 月
在模板构建过程中,通过不同预案层级的结 施节点(包括应对措施与保障措施)、28 421 条资
构特点,发现县级预案侧重于应急处置,而省、市 源提供机构节点(涵盖政府机构、社会组织等)、
级预案在应急准备与支持部分增加了保障计划 26 498 条风险节点(涉及建筑倒塌、交通中断等地
的内容,需要结合知识库进行智能生成。此外, 震相关风险),以及 19 145 条资源节点(包括医疗
在应急处置部分,特别是临震应急、强有感地震、 设备、救援工具、应急物资等),基于这些实体,共
地震谣传及外地地震波及事件,各层级均需要针 构建了 87 564 条“应对方式”关系、55 100 条“需要
对具体的地震情境制定相应的应急措施,这些内 资源”关系和 39 932 条“由机构提供”关系,最终
容在 JSON 模板中均进行了动态标记。 形 成 的 地 震 应 急 知 识 图 谱 被 存 入 Neo4j 图 数 据
为进一步量化模板库的结构特点,对预案各 库,图 5 展示了部分该图谱。结果表明,应对措施
部分的内容类型进行标注,区分静态内容、人工 和保障措施的数量最多,表明该类信息在地震应
交 互 动 态 内 容 和 LLM 填 充 动 态 内 容 。 结 果 表 急预案中的核心地位,同时资源提供机构的抽取
明,地震应急处置和资源调配是最依赖 LLM 动 量较大,反映了地震救援涉及的多方协作关系。
态填充的部分,而预案组织指挥体系及职责内容 2.3 应急预案自动生成工作流的分阶段实现
涉 及 较 多 的 人 工 决 策 ,需 要 人 工 交 互 确 认 。 此 2.3.1 用户需求解析与结构化输入构建
外,省、市级预案的保障计划部分同样需要结合 本阶段由 LLM 与结构化提示词协同完成,
知识库自动生成,以匹配实际的区域防灾规划。 旨在将用户输入的自然语言请求转化为机器可
2.2 知识库构建 识别的结构化信息。系统通过语义理解,自动提
2.2.1 实验数据获取及预处理 取预案编制所需的核心要素,包括预案类型、适
通过网页爬取与关键词匹配的方法,收集与 用层级与地理位置等关键信息。例如,针对用户
地震应急相关的应急预案文档,共计获取 2 934 输入“我需要为四川省都江堰市编制一个针对地
份预案。数据以省、市、县 3 级政府发布的地震应 震的应急预案,请你帮助我完成”,系统可识别出
急预案为主,同时为考虑地震引发次生灾害(如 预 案 类 型 为“ 地 震 应 急 预 案 ”,适 用 层 级 为“ 市
地质灾害、工业事故、学校建筑安全风险等)应急 级”,目标区域为“四川省都江堰市”。上述结果
处置的需求,适度补充了医疗、教育、工业安全、 最终被封装为如下 JSON 格式,用于作为后续任
地质灾害等相关领域的专项预案作为参考。 务执行的标准输入接口:
为保证数据质量,去除重复及无效文档,最 {“plan_type”: “地震应急预案”,
终筛选出 2 580 份具备唯一性的应急预案,用于 “plan_level”: “市级”,
知识抽取任务。为提升知识抽取的准确性,对数 “location”: “四川省都江堰市”}
据进行标准化预处理,包括格式转换、文本分割 这一结构化表达方式为后续的风险分析与
和无效文本过滤。首先,采用开源工具 MinerU 知识匹配阶段提供了统一数据支撑,有效提升了
将所有文档统一转换为 Markdown 格式,以提高 流程间的协同效率与任务接口的一致性。实验
结构化解析的可行性;然后,将文本块按照段落 验证表明,该阶段具备良好的语义解析能力与结
进行分块划分,以保证语义完整性,并去除少于 构映射准确性,能够实现用户意图的精准捕捉与
50 个中文字符或仅包含英文字符和数字的无效 格式规范化表达。
块;最后,共计获得 37 353 个文本块。 2.3.2 智能体驱动的震后风险分析
2.2.2 知识抽取及表示 OpenManus 是一种最新开发的智能体框架,
为构建地震应急知识库,本文利用 LLM 从 该框架结合 ReAct 机制(即推理+动作)、工具调
预处理后的文本块中提取关键知识。具体而言, 用、规划设计,实现了具备动态决策能力的智能
通过设计一个知识抽取的提示词,设定了标准化 化流程,其核心理念是“观察—思考—行动—再
的三元组抽取规则,确保数据结构符合知识图谱 观察”的循环方式,使智能体在处理复杂任务时
的存储需求。抽取的核心信息包括地震风险、应 能够进行迭代优化。在本文中,OpenManus 被用
对措施、所需资源及提供机构,并按照风险→措 于 执 行 地 震 灾 害 的 风 险 识 别 与 分 类 研 判 任 务 。
施→需要资源→资源所属机构这一完整链条进 图 6 展示了其在该任务中的响应流程,包括分析
行存储。 计划制定、关键词生成、外部数据检索与结果归
从预处理后的文本块中抽取了 43 853 条措 纳等关键步骤。