Page 268 - 《软件学报》2025年第9期
P. 268
黄俏娟 等: 基于大语言模型的事件常识知识图谱扩展方法 4179
表 12 不同方法计算事件相似度的示例
基于原始事件 抽象语义表示 句法依存树 多维度特征方法
原始事件 计算相似事件 计算相似事件 计算相似事件 计算相似事件
Top 3 Top 3 Top 3 Top 3
邀请客人、 想招待客人、 想招待客人、 招待他人、
招待客人 想招待客人、 招待他人、 主人在餐厅宴请客人、 接待他人、
迎接顾客 邀请客人 朋友接待客人 朋友接待客人
能帮助他人、 他人帮助、 他人帮助、 帮助朋友、
帮助他人 决定帮助他人、 能帮助他人、 寻求他人帮助、 帮助同学、
支持他人 他人帮助自己 愿意帮助他人 他人帮助自己
爱不合适的人、 对方忠于自己、 他人爱自己、 他人爱自己、
对方爱自己 对方重视自己、 对方体贴自己、 对方不欺骗自己、 爱他人、
他人爱自己 对方父母喜欢自己 他人像父母一样爱自己 他人喜欢自己
知道他人的喜好、 不知道事实、 知道真相、 知道真相、
知道事实 知道真相、 不知道真相、 知道候选人、 知道信息、
发现真相 不知道信息 不知道真相 知道秘密
把物品借给他人、 他人把物品归还自己、 把物品借给他人、 把失物归还给乘客、
把物品归还给他人 他人把物品归还自己、 归还物品、 他人把物品归还自己、 把书籍归还给图书馆、
把物品卖给他人 把物品卖给他人 把物品卖给他人 他人把物品归还自己
杯子在桌子上、 杯子被放在桌子上、 把杯子放在桌子上、 把杯子放在桌子上、
将杯子放在桌子上 杯子被放在桌子上、 把杯子放在桌子上、 杯子被放在桌子上、 把鱼饵放在鱼钩上、
把杯子放在桌子上 杯子在桌子上 杯子在桌子上 把手放在手刹上
吃汉堡包、 吃汉堡包、 不吃薯条、 不吃食物、
不吃汉堡包 吃太多汉堡包、 不吃食物、 不吃食物、 不吃薯条、
没有汉堡包 想吃汉堡包 想吃汉堡包 不吃垃圾食物
冰箱有食物、 冰箱有食物、 食品储藏室里没有食物、 食品储藏室里没有食物、
冰箱里没有食物 冰箱装满食物、 胃里没有食物、 没有食物、 胃里没有食物、
食品储藏室里没有食物 没有食物 胃里没有食物 没有食物
(3) 对于事件“把物品归还给他人”, 本文方法得到的前 3 个事件都包含“把…归还…”的结构. 而另外 3 种方法
在各自的前 3 个最相似事件中仅有一个事件包含该结构, 剩余的事件都是其他类型的结构. 例如, 与“把物品借给
他人”事件相比, “把…归还…”和“把…借给…”在表达的含义上有显著区别, 反映出事件包含的结构不相同导致相
似度更低. 这表明了事件结构在相似度计算中的重要影响.
(4) 通过引入事件的反义特征, 能够更准确地计算事件相似度. 例如, “不吃汉堡包”与“不吃食物”的相似度明
显高于“吃汉堡包”的相似度. “冰箱里没有食物”与“食品储藏室里没有食物”的相似度高于“冰箱有食物”的相似度.
这些结果表明了使用原始事件和抽象语义表示计算事件相似度的结果较差, 而句法依存树和本文方法计算结果较
好, 反映了句法依存树在处理反义词方面表现还不错. 同时, 这也证明了本文引入反义特征有效地改进了其他两种
计算事件相似度方法的局限.
通过分析相似度结果, 证实了基于语义角色的多维度事件相似度计算方法的有效性. 该方法能够从多方面精
确地捕捉了事件的深层语义, 从而显著提高相似度计算的可靠性. 因此, 这一方法增强了利用事件相似度进行事件
共享来扩展 ECKG 的实用性.
4.4.5 ECKG 事件三元组扩展结果
本文将 3 个扩展 ECKG 方法获得的常识知识进行剔除无关文本和符号, 以及将事件三元组经过相似度去重
等预处理后, 每种方法得到事件三元组的数量如表 13 所示.
为了确保扩展后的 ECKG 具有高质量, 本文对表 13 中的所有事件三元组进行验证. 验证过程包括两个主要步
骤: 首先, 使用微调过的 LLM 进行初次验证. 其次, 基于 LLM 验证的结果, 随机抽取不同方法生成的每种事件关系
下的 500 个三元组, 进行了人工审核的二次验证. 表 14 展示了验证结果的准确率, 通过这些数据可以得出以下结论.
(1) 对于使用 ek-prompt 和微调模型生成的事件三元组, 微调模型验证 4 种事件关系三元组的准确率均超过
93%. 其中, 时序关系的三元组准确率最高, 达到了 99.9%. 这一结果不仅说明了本文设计的 ek-prompt 有效地引导

