Page 237 - 《软件学报》2025年第12期
P. 237

5618                                                      软件学报  2025  年第  36  卷第  12  期


                    ● 语义信息获取困难
                    知识图谱作为非欧数据结构, 采用传统的欧氏几何处理方法会带来计算复杂, 维度过高等问题. 一些                               KGC  模
                 型对大型   KG  采用分割成子图处理, 这种机械的分割方式人为地破坏了知识图不同三元组本身的相互关系, 拟合
                 知识图语义时容易产生偏差, 导致本身语义信息获取困难.
                    ● 通用性和可扩展性差
                    现实世界是不断变化的, 因此          KG  应该迭代更新, 即需要不断地将新知识添加到              KG  中, 以扩展其结构, 并正
                 确地映射和描述现实世界. 其中关键挑战之一是多源信息的融合, 主要问题是如何正确地连接和融合不同语言的
                 信息和已有    KG  的信息. 多源信息融合的关键步骤是在补全过程中将信息转化为与                     KG  现有结构化信息一致的形
                 式, 这增加了   KGC  任务的难度.
                    ● 可解释性问题
                    新兴的大模型技术在        KGC  及相关任务表现较好, 但是大模型工作类似于黑匣子, 对捕获的事实知识缺乏一定
                 的可解释性, 难以用于精度较高的如医疗领域.

                  7   知识图谱补全技术的应用

                    KGC  技术在实践中具有广泛的运用, 本节主要介绍一般应用和华谱系统中的具体实现.
                  7.1   知识图谱补全技术一般应用
                    ● 知识图谱构建     [128]
                    KG  的构建通常包括自上而下或自下而上的方式. KG               的构建是一个动态的过程, 需要不断地补充缺失的实体
                 和关系, 以改善    KG  的结构. 借助  KGC  技术, 可以对构建的     KG  进行迭代更新和扩展, 以辅助        KG  的构建.
                    ● 新知识发现
                    KGC  是对实体关系等信息的预测, 如对多跳关系路径连接实体对间直接关系推理, 是发现新知识的重要手段,
                 KGC  技术已被广泛应用于基于        KG  的许多上游任务中, 如辅助       QA  系统, 实现信息的快速准确检索和获取.
                    ● 股市趋势预测
                    KGC  技术在金融领域越来越显示出巨大的价值, 例如预测金融市场状况                      [129] . 由于金融市场具有较强的实时
                 性, 即在金融市场中, 市场信息随时间动态变化, 通过基于金融事件和因素的金融                        KG  来实现对金融市场的动态预
                 测. 将长短期记忆神经网络等时间序列神经网络结构与注意力机制相融合, 构建预测模型. 该模型整合市场的整体
                 宏观动态序列和每个子市场的动态序列, 将发展预测应用于金融事件中, 实现金融                         KG  的动态补全.
                    ● 辅助医疗诊断
                    KG  具有组织和挖掘信息的能力, 在医学领域也展现出巨大的应用潜力. 许多研究者致力于医学                             KG  的研究.
                 利用基于电子病历构建的医学           KG  来辅助疾病的智能诊断时, 可以将患者的基本信息与现有的医学地图进行链
                 接, 然后应用   KGC  技术来挖掘与患者实体相关的疾病实体信息链接在一起, 从而为患者的疾病诊断提供准确的辅
                 助参考.
                    ● 自动推荐系统
                    自动推荐问题在少样本链接预测中具有挑战性的现实任务. 例如, 用户评论已经成为像                             Yelp  这样的  Web  服
                 务的重要组成部分. 收集用户评论等相关信息有助于形成基于位置的社交网络, 这种系统面临的一个挑战是当新
                 用户加入时, 平台中几乎没有现有的知识. 因此, 少样本链接预测模型, 如                    SEATLE [130] 通过  KGC  技术为更新信息
                 的用户建模等方法来解决推荐问题.
                  7.2   知识图谱补全技术在华谱系统中应用
                    在大数据知识工程        BigKE  的技术框架下, 吴信东团队推出了一套囊括所有华人姓氏的家谱系统, 即华谱系
                 统  [131–133] , 网址: https://www.zhonghuapu.com/ (如图  2  所示). 华谱系统通过对家谱数据进行碎片化知识融合, 为用
                 户提供寻根问祖、家族姓氏分布、人物之间关联等信息. 华谱系统中                      KGC  技术的应用包括以下       3  个方面.
   232   233   234   235   236   237   238   239   240   241   242