Page 245 - 《软件学报》2025年第9期
P. 245

4156                                                       软件学报  2025  年第  36  卷第  9  期


                 人  [32] 介绍了一种归纳学习框架, 专为解决常识知识图谱补全中的归纳学习难题而设计. 该框架能够处理未见过的
                 实体, 通过结合实体嵌入技术和图神经网络的结构信息, 有效提高了对新实体的表示精度. Bosselut 等人                          [33] 提出了
                 一种针对零样本常识问答的方法. 该方法能够动态生成和推理常识知识图谱, 有效应对叙事文中隐含的情境相关
                 的原因、结果和现状等知识的挑战.
                    上述方法依赖手工编写、自动化或半自动化从各种数据源筛选和验证常识知识, 依赖复杂的预处理过程, 导
                 致高昂的人工成本, 并且难以保证知识的高质量. 不同于这些方法, 本文结合                      LLM、设计特定的      ek-prompt 以及微
                 调模型策略来生成大规模且高质量的事件三元组, 显著提高了获取常识知识的效率. 此外, 提出了事件共享机制,
                 通过在同种关系下将相似事件关联的事件互相共享, 这一机制有效地保证了相似事件的三元组一致性, 防止了知
                 识碎片化. 整体而言, 本文提供了一种更为灵活和有效的常识知识获取方法来补全常识知识图谱.

                 1.2   LLM  补全知识图谱
                    近些年, 大语言模型已经广泛应用于多种自然语言处理任务. 例如, 针对知识图谱补全中长尾三元组和高质量
                 数据的稀缺性, 张宁豫等人        [34] 提出了一种基于知识协同微调的低资源知识图谱补全方法. 通过构建知识图谱补全
                 提示并采用协同微调算法, 有效地使用了知识图谱的结构化知识和语言模型中的隐式事实知识, 适用于链接预测
                 和关系抽取任务. 为了提升        LLM  预测知识图谱中缺失三元组的准确性, Zhang           等人  [35] 整合了知识图谱的结构信息
                 到  LLM  中, 通过转换现有    LLM  范式为结构感知设置, 并设计了知识前缀适配器来捕获实体与关系的结构信息,
                 将信息传送给     LLM  以提高预测精度. Wei 等人      [36] 设计了一个名为   KICGPT  的知识图谱补全框架, 该框架通过集
                 成  LLM  和基于三元组的知识图谱补全检索器, 并采用知识提示学习策略, 以指导                     LLM  高效地进行知识图谱补全.
                 Luo  等人  [37] 专注于时间知识图谱补全任务, 基于      LLM  的生成能力和对时间知识图谱推理的调整, 通过对参数的微
                 调和分析   LLM  内在的变异因素, 提高了整个图谱的补全性能. Yao             等人  [38] 通过将知识图谱中的三元组与        LLM  结
                 合, 使用实体和关系的描述作为输入提示, 并利用              LLM  的响应来预测事件. Pan     等人  [39] 提出了一种将  LLM  和知识
                 图谱进行统一的前瞻性路线图, 该路线图主要通过知识图谱增强                     LLM、LLM   增强知识图谱, 以及      LLM  与知识图
                 谱的协同工作, 通过数据和知识驱动的双向推理增强                 LLM  和知识图谱. Li 等人    [40] 为了解决知识图谱补全任务中
                 遇到的文本语料的静态和噪音问题, 提出了一种上下文蒸馏方法. 该方法首先指导                         LLM  赋予三元组丰富的上下文
                 信息. 再引入重建和情景化辅助机制, 使得较小的知识图谱补全模型能够吸收这些丰富的三元组信息.
                    与其他使用     LLM  进行知识图谱补全的研究相比, 本文方法显得更为直接. 通过设计特定的                      ek-prompt 和微调
                 模型, 专门扩展以事件为中心的常识知识图谱. 特别地, 本文引入的事件共享机制解决了由于                            LLM  偏差可能引起
                 的信息不一致问题, 从而确保了图谱中相似事件的信息一致性. 这不仅有效扩展事件知识图谱的规模, 还为知识图
                 谱的应用和深化开辟了新的路径.

                 2   基础知识

                    本节将介绍在扩展       ECKG  所需的准备工作, 包括主要的事件关系定义和如何辨别事件是否存在着这些关系.
                 接下来, 将阐述相关的概念和基础知识.
                    在种子   ECKG  中, 本文定义了    4  种事件关系, 具体如下.
                    (1) 因果关系: 一个事件的出现可能导致另一个事件的发生, 用三元组表示为<E 1 , 导致, E 2 >. 例如, 减肥导致
                 变瘦.
                    (2) 时序关系: 一个事件在时间上先于另一个事件发生, 三元组表示为<E 1 , 先于, E 2 >. 例如, 订婚先于结婚.
                    (3) 条件关系: 一个事件的发生基于一定的前提条件基础上, 三元组表示为<E 1 , 是条件, E 2 >. 例如, 参军是参加
                 战斗的前提条件.
                    (4) 子事件关系: 一个过程事件发生时会涉及一系列相关的子事件出现, 三元组表示为<E 1 , 有子事件, E 2 >. 例
                 如, “找工作”这一事件包含“投简历、准备面试、参加面试、等待面试结果”等一系列的子事件.
                    从常识的角度理解, 事件之间的发生都存在因果、时间上的先后顺序, 以及基于特定的前提条件. 因此, 在扩
   240   241   242   243   244   245   246   247   248   249   250