Page 249 - 《软件学报》2025年第12期
P. 249
5630 软件学报 2025 年第 36 卷第 12 期
capture valuable interconnections between entities across different views. This study argues that global and sequential perspectives are
essential for understanding entities beyond the local view by enabling interaction between disconnected and distant entity pairs. More
importantly, it emphasizes that the aggregated information must be complementary across different views to avoid redundancy. Therefore, a
multi-view framework with the differentiation mechanism is proposed for inductive KGC, aimed at learning complementary entity
representations from various perspectives. Specifically, in addition to aggregating neighboring information to obtain the entity’s local
representation through R-GCN, an attention-based differentiation mechanism is employed to aggregate complementary information from
semantically related entities and entity-related paths, thus obtaining global and sequential representations of the entities. Finally, these
representations are fused and used to score the triples. Experimental results demonstrate that the proposed framework consistently
outperforms state-of-the-art approaches in the inductive setting. Moreover, it retains competitive performance in the transductive setting.
Key words: inductive knowledge graph completion; multi-view framework; differentiation mechanism; knowledge graph
1 引 言
知识图谱是一种多关系图, 其中节点表示实体, 边表示关系. 它们对于各种各样的知识密集型应用都至关重
要, 比如问答系统、推荐系统以及对话系统 [1,2] . 然而, 现实中的知识图谱通常都是不完备的, 这就需要运用知识图
谱补全技术补充其中的缺失边, 从而促进知识图谱的自动构建和验证. 更重要的, 现实中的知识图谱通常是动态变
化的, 因为总会有实体持续地被添加或删除. 因此, 真实可用的知识图谱补全方法需要具有归纳性, 从而能够泛化
到加入知识图谱的新实体上. 例如, 在图 1 中, 给定一个三元组“(China, participated in, 2008 Summer Olympics)”, 模
型就需要能够泛化到新实体“2012 Summer Olympics”上, 并且能够预测“China”和“2012 Summer Olympics”之间的
缺失边.
训练图 2008夏季奥运会 英国 推断图
2008夏季奥运会, 官方称作第二十九届 英国, 全称为大不列颠暨北爱尔兰联合王国,
夏季奥林匹克运动会, 是于2008年在... ? 是位于西欧并具有海外领地的...
位置
北京 首都 伦敦
北京, 曾称“北平”, 是中华 伦敦是英国首都, 也是英国最大都
人民共和国的首都... 参加 市以及其构成国英格兰的首府...
半归纳式
? 全归纳式
位置 位置
清华大学 首都 帝国理工学院
清华大学是၂所位于 帝国理工学院, 是一所位于
北京市海淀区清华园的... 英国伦敦的公立研究型大学...
中国 2012夏季奥运会
? 2012夏季奥运会, 官方称作第三十届
中国, 全称为中华人民共和国, 首都...
夏季奥林匹克运动会, 是于2012年在...
已见过实体 未见过实体
图 1 归纳式知识图谱补全的示例
为了在进行知识图谱补全时建模新的实体, 现有工作大多使用基于文本的方法. 它们使用预训练语言模型来
编码每个实体相关的文本得到实体的表示, 然后利用传统的知识图谱补全模型对三元组打分, 比如 TransE [3−5] 或余
弦相似度 [6,7] . 然而, 这些方法都有一定的局限性, 因为它们只利用了实体相关的文本信息而忽视了知识图谱天然
[8]
的图结构. 为了更进一步引入知识图谱的结构信息, 一系列工作, 例如 StATIK 就提出了一些混合模型. 它们在预
训练语言模型之上堆叠图神经网络以融合文本和结构信息. 然而, 这些工作也有局限性. 它们只能够从每个实体的
邻居聚合信息, 从知识图谱的局部视角学习实体的表示. 结果是, 它们无法捕获可从知识图谱的其他视角中得出的
有价值信息.
本文认为除了局部视角以外, 探索知识图谱中的全局视角和序列视角对于理解实体的语义是至关重要的.
(1) 从全局视角学习意味着通过知识图谱中其他相关的实体来理解一个实体, 不管它们之间是否有边相连. 知识图
谱中的实体除了会被显式边相连, 也会存在隐式的语义关联, 而这种关联往往不会以显式边的形式表达. 因此, 从

