Page 244 - 《软件学报》2025年第9期
P. 244
黄俏娟 等: 基于大语言模型的事件常识知识图谱扩展方法 4155
GPT-3.5-Turbo 模型, 以进一步丰富和扩展事件三元组.
(3) 为了确保大规模事件三元组的高精度, 对 GPT-3.5-Turbo 模型进行特别的微调, 专门用于评估新三元组的
正确性.
(4) 引入 OpenAI 的嵌入模型及多维度语义的事件相似度计算和共享机制. 这一机制独特地结合了语义角色标
注、含句子成分的语义角色、语义角色标注结构与事件反义多重特征, 获得了精确的种子 ECKG 事件的相似度.
在相同关系中, 将相似度高的 ECKG 事件关联的事件进行共享. 该机制显著地解决了 LLM 在生成高度相似事件
的三元组时出现的不一致问题, 极大地优化了获取新三元组的过程.
实验结果表明, 本文方法在扩展种子 ECKG 任务上表现出显著的精确度和有效性, 为常识事件三元组的获取
提供了一种新的思路. 扩展后的 ECKG 涵盖丰富的常识知识, 能够为多种人工智能领域的研究和应用提供了可靠
的常识知识支持.
本文第 1 节探讨获取常识知识和知识补全的相关研究. 第 2 节介绍扩展 ECKG 的基础知识. 第 3 节讨论获取
常识知识和扩展 ECKG 的具体方法. 第 4 节通过实验评估本文方法的效果. 第 5 节总结全文及未来工作的展望.
1 相关工作
1.1 常识知识图谱补全
常识知识可以通过人工、自动化和半自动化的方式获取. 对于人工方式, ATOMIC [10] 使用众包的方式从事件
的注解中提取“if-then”形式的常识知识. Wang 等人 [13] 从多种数据源中收集和筛选常识相关的事件三元组, 构建了
一个以事件为中心的高质量种子知识图谱. Cyc [16] 是首个大规模的常识知识库, 其内容由工程师手工编辑, 并采用
CycL 语言对这些常识知识进行形式化. WordNet [17] 由词典编辑者以文本的形式输入而构成的常识知识库, 其涵盖
英文单词、短语和同义词. OMCS [18] 通过互联网从用户中搜集常识知识, 允许网络用户以预设模板或自由文本方
式贡献常识知识. 在自动获取常识知识的工作中, Nguyen 等人 [1] 提出从网络文本中自动构建大规模常识知识库的
方法, 主要利用搜索查询、句法分析和 RoBERTa 模型 [42] 提取并丰富知识的语义信息. TransOMCS [19] 将大型语言
知识库转换为常识知识库, 并使用排序模型选取高质量的知识. Romero 等人 [20] 从网络资源中获取概念属性常识,
并通过搜索日志、问答论坛和统计的方法获取常识并验证正确性. 曹亚男 [21] 提出了从网络语料库中提取因果常
识的方法, 包括识别文本中的因果关系和基于贝叶斯学习因果边界划分两个阶段. Bosselut 等人 [22] 基于 ATOMIC
和 ConceptNet 开发了 COMET 系统, 能够自动生成较高精度的自然语言描述的常识知识. 半自动获取方法结合人
工与自动化技术, 例如 ConceptNet [11] 通过词法句法模式从 OMCS 知识库中提取常识知识三元组, 再结合人工规则
扩展知识的覆盖率. WebChild [23] 基于 WordNet 获取概念属性的常识知识, 进而以模式匹配和半监督学习从网络文
本中增强这些知识. Learner 系统 [24] 采用类比方法提取常识知识, 要求用户提供概念相关的事实, 从而获取更多常
识信息. 曹聪等人 [25] 提出了一个人机交互的方法, 利用机器动态生成常识性的问题, 用户通过回答问题贡献了他
们大脑中的常识, 再通过人工筛选和清理进而获取到相关的常识知识.
将获取的常识知识进行补全常识知识图谱的工作中, 研究者们采用多种方法以提高知识图谱的规模和知识覆
盖率. 王亚 [26] 通过设计常识性逻辑规则对图谱进行推理, 以发掘事件间的常识关系. 此外, 还使用常识知识的上下
位关系来生成新事件, 以扩大事件知识图谱的规模. 邓鹏 [27] 融合语义角色和 AMIE [43] +关联规则挖掘技术, 通过语
义增强和规则过滤剪枝, 提高了事件图谱补全的准确性. Meilicke 等人 [28] 提出了一种结合规则和嵌入方法来进行
知识图谱补全, 从而有效提升知识图谱补全的性能. 针对 ConceptNet 的补全任务, Li 等人 [29] 开发了一个神经网络
模型, 该模型可以自动修改和生成新的三元组, 并对新三元组的正确性进行评分. Malaviya 等人 [30] 设计了一个基
于概念结构和语义上下文的常识知识库补全模型, 通过图卷积网络和图致密化技术将预训练语言模型的学习迁移
到知识图谱上, 增强知识的上下文表示能力. Niu 等人 [31] 构建了一个逻辑和常识指导的嵌入模型. 该模型学习事件
的时间敏感表示和时间独立表示, 有效捕捉事件的及时性和因果性, 并从常识的视角理解事件间的关系. 此外, 他
们引入了辅助的常识知识来提高事件可能性评估的准确性, 显著提高了时间知识图谱补全的性能提升. Wang 等

