Page 271 - 《软件学报》2025年第9期
P. 271
4182 软件学报 2025 年第 36 卷第 9 期
结果:
已知场景: 李红和张姨是家人关系, 当张姨患病时, 那么
李红希望张姨怎么样? Y: 康复(张姨)
上下位知识库 愿望知识库
事实: 事实:
家人(李红, 张姨). 家人(张姨, 李红).
规则: 规则:
是一个(X, 人) :- 家人(X, Y). Y: (人) 愿望(X, 康复(Y)) :- 是一个(X, 人),
是一个(Y, 人) :- 家人(X, Y). 是一个(Y, 人), 家人(X, Y)
查询: 查询:
是一个(李红, Y).
愿望(李红, Y).
是一个(张姨, Y).
图 15 多知识库推理
5 总 结
在研究初期, 课题组成员投入了大量的人力资源构建了一个高精度的种子事件常识知识图谱 (ECKG). 由于其
规模较小, 在实际应用中发挥的作用受限. 在现有研究中, 以事件为中心的大规模中文常识知识图谱相对较少. 此
外, 常识知识通常不会在自然语言中直接表述, 更多地反映在人们的日常生活和潜意识中. 针对这些问题, 本文提
出了一种基于 LLM 扩展 ECKG 的方法. 本文主要是通过利用 GPT 系列 LLM 的强大数据处理和知识生成能力,
获取更多关于 ECKG 的事件三元组, 以扩大其规模.
具体来说, 本文首先设计了 4 种事件关系的高质量 ek-prompt, 并调用了 GPT-4-Turbo 模型初步生成事件三元
组. 其次, 通过特定的三元组数据集对 GPT-3.5-Turbo 模型进行微调, 并使用微调后的模型进一步生成和验证新的
事件三元组. 特别地, 为了解决 LLM 生成的相似事件三元组中存在不一致性的问题, 本文基于语义角色多维度特
征获得了精确的事件相似度, 并引入了事件共享机制. 这一策略极大地扩展了 ECKG 的规模, 同时也提高了相似
事件三元组的一致性.
通过实验证明, 本文的方法能够高效地获取大规模的常识事件三元组, 并且新获取的三元组经过自动化评估、
人工评估以及推理应用评估, 证实了具有高质量和实用性. 这不仅保持了 ECKG 的高精度特性, 还显著扩大了其
规模, 丰富了常识知识库.
在未来, 仍有很多有意义的工作值得我们去探索. 首先, 计划对 ECKG 进行更多层次的自动扩展, 以进一步扩
大常识知识图谱. 其次, 将实现基于人类反馈的增强学习 (reinforcement learning from human feedback, RLHF) 方法 [72] ,
通过广泛收集用户的反馈来设计奖励机制以优化现有的 LLM 学习能力, 提升事件三元组生成和验证的准确性及
有效性. 最后, 为了验证和提升 ECKG 的可用性和应用价值, 计划探索多方面的应用, 包括开发一个常识知识的自
动问答系统、事件预测以及大规模常识知识库的常识推理等应用. 通过这些未来研究, 期望能够显著提升 ECKG
的质量与应用范围, 使其在自然语言处理和人工智能领域发挥更大的作用和价值.
References:
[1] Nguyen TP, Razniewski S, Weikum G. Advanced semantics for commonsense knowledge extraction. In: Proc. of the 30th Web Conf.

