Page 269 - 《软件学报》2025年第9期
P. 269

4180                                                       软件学报  2025  年第  36  卷第  9  期


                 模型生成常识事件三元组, 还显示了专门为生成更为具体的事件三元组微调的模型, 充分学习到了训练数据中的
                 特征, 能够生成了高质量的事件三元组.

                        表 13 不同方法获取的三元组数量                     表 14 微调模型与人工验证事件三元组的准确率 (%)

                                                     三元组                              微调模型      人工验证
                    方法      事件关系 三元组数量        总计                   方法       事件关系
                                                     总数量                             验证准确率       准确率
                              因果     226 845                                  因果       93.04      96.2
                              时序     187 192                                  时序        99.9      97.8
                   ek-prompt                 798 838             ek-prompt
                              条件     212 103                                  条件       98.21      97.6
                             子事件     172 698                                 子事件       96.08      96.6
                              因果     234 609                                  因果       95.76      96.8
                              时序     163 253                                  时序       99.88       98
                 微调模型生成                      783 091  2 806 155  微调模型生成
                              条件     211 086                                  条件       97.44      97.8
                             子事件     174 143                                 子事件       93.72      97.4
                              因果     395 495                                  因果       82.94      95.6
                              时序     265 596                                  时序        93.8      98.2
                 事件共享机制                     1 224 226          事件共享机制
                              条件     316 446                                  条件       84.75       96
                             子事件     246 689                                 子事件       86.25      97.8
                    (2) 通过事件共享机制获取的新三元组, 虽然准确率略低于基于                   ek-prompt 和微调模型生成的三元组, 但整体
                 表现仍然不错, 特别是在时序关系中, 准确率达到了               93.8%. 这体现了事件共享机制扩展         ECKG  的可行性, 确保了
                 相似事件的三元组信息一致性, 并获取了一定数量的事件三元组.
                    (3) 人工抽样审核的结果显示, 3        种扩展方法中的      4  种事件关系的准确率均在        95%  以上. 这表明了本文微调
                 的  LLM  用于验证事件三元组的有效性和可靠性, 证明它可以作为验证大规模事件三元组正确性的有力工具.
                    总体而言, 上述的验证结果充分证明了本文方法在获取事件三元组方面具有高精确度和可靠性, 有效地支持
                 了扩展   ECKG  的工作.
                    基于事件三元组正确性的验证结果, 本文统计了微调模型评估为正确的三元组数量, 具体的数据见表                                  15. 从
                 表  15  可以看出, 在  3  种扩展  ECKG  的方法中, 利用  ek-prompt 和微调模型生成的事件三元组, 评估为正确的总三
                 元组数量较为接近. 值得一提的是, 通过引入事件共享机制获取的正确三元组数量最多. 这一现象表明了事件共享
                 机制扩展   ECKG  的可行性和有效性, 同时也促进了相似事件三元组的一致性.
                    与此同时, 本文对表      15  中的所有事件三元组进行了合并和去重处理, 从而获得最终增补到                     ECKG  的总三元
                 组数量, 如表    16  所示. 这些数据表明, 本文方法有效地扩大了             ECKG  的规模并丰富了其知识库, 能够为使用
                 ECKG  进行更广泛的应用和研究提供了可靠的常识知识资源.


                      表 15 不同方法获取的正确三元组数量                            表 16 增补到    ECKG  的三元组数量

                                                     三元组             事件关系                三元组数量
                    方法      事件关系 三元组数量        总计
                                                     总数量               因果                  666 193
                              因果     211 056                           时序                  592 691
                              时序     187 005                           条件                  653 605
                   ek-prompt                 772 295
                              条件     208 306                          子事件                  520 523
                             子事件     165 928                           总计                 2 433 012
                              因果     224 661
                              时序     163 057
                 微调模型生成                      756 607  2 587 011
                              条件     205 682
                             子事件     163 207
                              因果     328 023
                              时序     249 129
                 事件共享机制                     1 058 109
                              条件     268 188
                             子事件     212 769
   264   265   266   267   268   269   270   271   272   273   274