Page 223 - 《软件学报》2025年第12期
P. 223

5604                                                      软件学报  2025  年第  36  卷第  12  期


                 元组数据, Xiong  等人  [43] 提出少样本  KGC (FKGC) 的概念并提出采用      GMatching  模型解决  FKGC. 根据解决问题
                 的角度, 已有的少样本      KGC  方法可以分为基于度量学习、元学习、优化学习以及大模型的方法.
                  4.1   度量学习的  FKGC  模型
                    基于度量学习的       FKGC  模型从训练任务中学习一般通用的距离公式或匹配函数, 然后推广到新的任务. 已有
                 的基于度量的     FKGC  模型通常共享基于匹配网络的框架. GMatching          [43] 使用局部图结构和实体嵌入信息构建匹配
                 函数, 包括邻居编码器和匹配处理模块. 与传统              KGC  模型相比, 该模型可对任意关系预测, 无需重新训练模型, 训
                 练代价较低. 然而, 该模型邻居编码器通过平均聚合捕获实体邻域表示, 忽视无效实体的负面影响. 为此, FSRL                             [44]
                 采用注意力机制的关系感知异构邻居编码器对不同邻域信息分配不同的权重, 同时聚合更多的三元组信息增强交
                 互, 减少无效实体影响. 但是, FSRL     在所有的任务关系中给不同的邻居分配固定的权重, 影响系统有效性. 因此, Sheng
                 等人  [45] 提出  FAAN  模型, 它采用自适应注意力邻居编码器动态获取实体预训练的嵌入及其角色感知的邻居嵌入,
                 同时使用   Transformer 获取关系和实体对嵌入的动态信息, 提高了模型的鲁棒性. 然而, FAAN                  的邻居编码器只针
                 对实体的动态信息进行改善, 忽视了三元组间和三元组内的交互信息. 实体交互能够提供有价值的细粒度语义信
                           [46]
                 息, TransAM  将查询实体和参考实体序列化为序列, 并应用具有局部全局注意力机制的转换器结构来捕获三元
                 组实体内和实体间的交互信息. 与其他模型比, 该模型能够捕获更多的三元组结构语义, 但忽视了三元组内部的信
                 息, 不能很好地处理复杂少样本关系. 基于度量学习的                FKGC  模型, 在改进已有方法不足的同时, 也在寻求更好的
                 匹配方法计算参考集和查询集相似得分. 表              6  总结了基于度量学习的      FKGC  模型.

                                               表 6 基于度量学习的       FKGC  模型

                  模型名称                     优点                                     不足
                                                                忽视无效实体的影响, 对邻域中的信息看成同等重要, 没有
                        [43]
                GMatching  局部图信息; 能处理新关系, 无需重新训练模型, 代价小
                                                                区别看待
                      [44] 不同邻域信息赋予不同权重; 增加参考三元组集成更多 给邻域不同信息赋予静态的权重, 导致实体固定嵌入, 影响
                  FSRL
                         的语义信息                                  系统整体性能
                  FAAN [45]  使用实体和关系动态属性特征自适应动态加权               淡化了实体三元组内部和三元组间的交互特征
                 TransAM [46] 捕获三元组内部和之间的交互信息; 新的匹配函数           三元组内部信息使用不足; 不能处理复杂的少样本关系

                  4.2   元学习的  FKGC  模型

                    元学习 (meta learning) [47] , 又称学会学习  [48] , 旨在帮助新任务在训练样本匮乏的场合快速学习. 在           FKGC  中,
                 元学习在训练任务中学习对应三元组的公共特征, 然后在新的任务上泛化使用, 典型的有                            MetaR、GANA、Meta-
                 iKG  等模型. MetaR [49] 是元学习在  FKGC  上的首次尝试, 核心是特定关系元生成器生成实体对表示, 梯度元加速模
                 型迭代学习以完成       FKGC  任务. MetaR  能最大限度减少查询损失总和, 独立于参考集, 因此更加稳健. 但是, MetaR
                 计算关系元时忽视了参考集中不同实体三元组对关系表示的作用不同. GANA                         [50] 采用全局和局部结合的框架, 借
                 助注意力机制和      LSTM  聚合器改进    MetaR  嵌入和关系元计算, 以减少在稀疏或缺少恰当邻居表示少样本关系时
                 噪音邻居的影响. 然而, 该模型在         N-N  复杂关系上表现不佳. HiRe    [51] 扩展  GANA  提出联合捕获包括实体、三元组
                 及上下文这    3  个级别关系信息的框架, 以实现更好的性能. 但是, 训练参数和复杂度相对较高. 基于                       MetaR, Meta-
                 iKG [52] 用局部子图传递子图特定消息, 并通过元梯度和元学习快速学习可转移模式. 与其他元学习模型相比, Meta-
                 iKG  引入多样本关系学习的更新过程以对少样本学习进行泛化. 然而, 它只能提取子图结构语义, 无法对有向图反
                 对称关系建模. 同时, 对任务查询集参数的学习存在偏差. Meta-KGR               [53] 把元学习和强化学习相结合, 用强化学习训
                 练代理搜索目标尾实体和推理路径, 同时元学习参数快速适应少样本的任务. 该模型能够提供多条路径推理, 且解
                 释性较好. 但是, 推理性能对路径依赖较强, 缺失路径时, 效果较差. 上述方法都是基于元学习的典型, 各个关注的
                 方面不同, MetaR  关心元学习解决少样本学习问题, GANA             强调消除邻居噪音, HiRe 捕获       3  个级别的关系信息丰
                 富学习特征, 而    Meta-iKG  则关注用局部子图建模处理         FKGC  和  Meta-KGR  侧重元学习和强化学习结合等. 表        7
                 总结了基于元学习的       FKGC  模型.
   218   219   220   221   222   223   224   225   226   227   228