Page 250 - 《软件学报》2025年第12期
P. 250

童翰文 等: 带有差异化机制的多视角归纳式知识图谱补全框架                                                   5631


                 相关的实体上聚合语义信息可以帮助增强一个实体的语义, 特别是在归纳式设定下理解未见过的实体. 例如, 在图                                 1
                 中, 尽管一个见过的实体“2008 Summer Olympics”和一个未见过的实体“2012 Summer Olympics”之间没有显式的
                 边, 它们却拥有相同的概念和相似的语义. 对于“2012 Summer Olympics”来说, 从一个见过的实体“2008 Summer
                 Olympics”聚合语义信息可以建立起见过和未见过实体之间的联系, 从而进一步帮助理解未见过实体的语义.
                 (2) 从序列视角学习意味着从实体相关联的路径上理解一个实体. 知识图谱中的实体除了有局部邻居外, 路径还会
                 将实体和距离它若干跳的实体连接起来, 显式地反映出知识图谱中实体间的多跳关联. 因此, 通过允许远距离但相
                 连的实体之间进行交互, 便能够沿着路径聚合实体信息, 从而捕捉到实体间的多跳关联, 更好地理解实体的语义.
                 而且, 这种关联也是无法通过局部或全局视角捕捉到的. 例如, 在图                   1  中, 沿着一条路径“(2008 Summer Olympics,
                 location, Beijing), (Beijing, capital of, China)”聚合信息就能够保证“2008 Summer Olympics”和一个远距离但相连的
                 实体“China”之间产生交互. 这会有助于更好地理解“2008 Summer Olympics”并且识别出它和“China”之间的关系.
                 更重要的是, 这其中存在的一个潜在的问题是从多个视角聚合到的信息可能会出现冗余. 例如, 一个语义关联的实
                 体可能恰好也是一个邻居实体, 就像三元组“(The Dark Knight Rises, prequel, The Dark Knight)”. 两部电影“The
                 Dark Knight Rises”和“The Dark Knight”既是语义相似的实体, 又是邻居实体, 这可能会导致从局部视角和全局视角
                 聚合得到重叠的信息, 进一步导致通过多视角捕捉互补信息的目标失效. 因此, 本文强调从多个视角聚合信息时避
                 免冗余, 确保聚合信息的多样性和互补性是至关重要的.
                    本文为了从多个视角全面理解实体的语义, 以更好地进行归纳式知识图谱补全, 提出了一个带有差异化机制
                 的多视角知识图谱补全框架. 该框架包含一个带有差异化机制的多视角编码器和一个打分解码器. 编码器的目标
                 是从局部、全局、序列这         3  个视角学习互补的实体表示, 而解码器的目标是基于这些习得的表示对三元组打分.
                 具体而言, 本文首先使用一个预训练语言模型来编码每个实体的名称和描述得到它的文本表示. 基于该表示, 本文
                 使用  3  个模块来从多个视角聚合多样化的信息. (1) 结构编码模块使用关系图卷积网络                       [9] 建模知识图谱的空间局
                 部性  [6] , 聚合邻居信息以得到实体的局部表示. (2) 全局编码模块使用一种全局注意力机制来建模知识图谱中任何
                 一对实体之间的语义相关性, 从相关实体聚合语义信息来获得实体的全局表示. 本文进一步设计了一种基于注意
                 力的差异化机制, 以缓解局部表示和全局表示之间的过度注意问题, 避免全局视角聚合和局部视角重叠的信息.
                 (3) 路径编码模块使用一个带有位置编码的             Transformer [10] 编码层来建模实体间的多跳关联, 沿着多条实体路径聚
                 合实体信息以得到实体的序列表示. 和全局视角类似, 序列视角依然使用差异化机制来避免它从多条路径聚合序
                 列结构信息时的信息冗余. 最终, 本文通过一个融合层对各种各样视角学到的表示进行融合, 得到最终的实体表
                 示. 在打分解码器中, 本文使用一个基于转移的模型               RotatE [11] , 基于实体的最终表示对三元组打分. 正确的三元组
                 应当得到尽可能高的分数.
                    本文的研究贡献总结如下.
                    (1) 为归纳式知识图谱补全任务提出了一个新颖的、带有差异化机制的多视角知识图谱补全框架. 最显著的
                 特点是它保证了知识图谱中局部、全局、序列视角信息聚合的多样性和互补性, 从而学习到多个视角互补的实体
                 表示.
                    (2) 使用一个带有差异化机制的多视角编码器和一个打分解码器实现了上述框架. 编码器使用了一个基于注
                 意力的差异化机制来避免过度注意的问题, 从各种视角学习独特的实体表示. 解码器基于实体表示, 使用一个基于
                 转移的模型对三元组打分.
                    (3) 在归纳式设定下对所提方法进行了充分的实验. 实验结果证明它超越了现有最先进的方法. 此外, 所提方
                 法在直推式设定下也保持着有竞争力的性能.
                    本文第   2  节介绍知识图谱补全的相关工作和研究现状. 第               3  节给出问题定义并且对方法进行整体概述. 第             4
                 节详细介绍所提方法, 包括了带有差异化机制的多视角编码器、打分解码器以及模型的训练与推断过程. 第                                   5  节
                 给出本文方法的实验结果, 包括了与各个基线模型的实验结果对比, 以及对各个模块的分析与消融实验. 第                                6  节总
                 结全文.
   245   246   247   248   249   250   251   252   253   254   255