Page 206 - 《软件学报》2025年第12期
P. 206

吴信东 等: 华谱通: 基于知识推理的家谱问答大语言模型                                                    5587



                                                                您:
                                                               请介绍一下曾国藩
                                                                华谱通:

                  欢迎来到华谱通系统, 本系统致力于根据家谱文档信息来回答用户的提问, 同时提供详细的家谱查询、家谱信息解读、家庭关       提示
                    系解析等功能。您可以询问感兴趣家谱中的人物和关系, 例如询问系统“ 曾国藩是谁” , “ 曾广铭的爷爷是谁" 等等。
                                 具体使用可参考  华谱通使用手册
                                                                              正在检索中, 请稍后. . .
                 1. 刷新聊天界面                                                        取消
                           2. 选择家谱
                     曾国藩家谱
                     红楼演示家谱 •  月之暗面Kimi  3. 选择大模型接口                   点击此处终止家谱查询进程
                     杨氏一都阳谱 •  智谱清言
                     江山市鹿溪林 •  星火大模型
                    氏宗谱    •  ChatGLM3-6B
                                                                                   点击此处终止大模型答案生成进程
                     曾国藩家谱  月之暗面Kimi  4. 消息输入框    5. 发送消息按钮      曾国藩家谱  月之暗面Kimi
                  请介绍一下曾国藩                               发送   请介绍一下曾国藩
                                 (a) 页面基础功能                                  (b) 问答中断机制
                                         图 11 华谱通系统页面基础功能和问答中断机制

                  2.8   系统框架适用性分析
                    华谱通作为一个基于知识推理的大语言模型问答系统, 在家谱知识问答领域的表现已经达到了先进水平. 以
                 华谱通为参考, 本节将大语言模型在特定领域知识上实现高效问答的技术路线做出以下总结.
                    ① 领域知识图谱是大语言模型在特定领域实现精准问答的根本要求. 领域知识图谱的主旨是精准的知识归
                 纳, 即不需要海量的知识储备, 但力求每条知识都是该领域的核心内容, 且形成的知识网能够概括该领域的主要内
                 容. 例如, 华谱平台仅通过“父亲”“儿子”“女儿”“丈夫”和“妻子”这              5  种基础关系, 就能实现千万级别的人物关系存
                 储, 这为后续的知识推理提供充足的知识储备.
                    ② 完备的知识推理规则是保证领域知识被正确利用的必要条件. 与一般的知识检索增强框架仅依靠语义相
                 似性获取大模型的提示信息不同, 基于知识图谱的推理框架可以通过核心知识点定义完备的推理逻辑, 以可解释
                 的推理路径获取所有与用户问题高度相关的候选答案. 例如, 根据家谱中                       5  种基础关系定义的     26  条  Jena 推理规
                 则, 华谱通可以实现常见亲属关系的精准推理, 这极大提升了大模型提示信息的完整性.
                    ③ 冗余信息筛选机制是满足知识推理结果确定性的重要条件. 由于用户提供问题的模糊性和领域知识图谱
                 结构的复杂性, 知识推理规则在考虑推理完备性的同时, 势必会引入部分二义性信息干扰大模型解答, 如同名实体
                 或冗余推理路径. 因此, 冗余信息筛选机制主要通过同名实体消歧与最优推理路径选择技术, 过滤对大语言模型问
                 答没有实质帮助的知识. 例如, 华谱通中部署的多条件匹配机制和路径排序算法分别从同名人物和多关系路径的
                 角度, 进一步提升用户问题条件下的知识推理结果确定性, 以便更有效地提示大模型回答问题.
                    ④ 基于大语言模型的人机交互接口是大模型知识问答系统正常运转的基本保障. 用户提供的自然语言问题
                 与知识图谱的结构化存储形式存在差异, 因此, 在实际问答过程中, 需要先将用户问题转化为知识三元组格式, 才
                 能正常开展后续的知识推理与冗余信息筛选等环节. 此外, 为保证用户在问答过程中的体验感, 还需要将推理出的
                 结构化知识以自然语言的形式反馈给用户. 为此, 华谱通利用大语言模型强大的自然语言理解能力与对话功能, 实
                 现不同数据结构的格式转化, 以连通“用户问题→知识推理→系统反馈”的问答流程, 从而保障系统的正常运行.
                    此外, 如前文提到的系统响应异常处理机制              (第  2.6  节) 和数据隐私保护功能    (第  2.7  节), 都是保证华谱通系统
                 鲁棒性的重要功能.
                    理论上, 在上述技术路线的协同运作下, 华谱通可以被作为一个基础的问答框架, 迁移到任意领域的知识问答
                 场景中   (如医疗、物理、生物制药等), 这展示了华谱通系统框架广泛适用性. 然而, 现实生活中存在动态更新的领
                 域知识, 而目前华谱通中的知识推理框架和路径排序算法需要通过领域专家定义推理规则和关系分数, 该过程限
                 制了系统框架在动态变化知识上的适用性. 为实现更加灵活的大模型知识推理问答框架, 本文在总结部分论述了
                 华谱通在可扩展性方向上的研究思路.

                  3   系统功能展示与问答场景分析

                    华谱通支持多种场景的家谱知识问答, 包括人物亲属查询、人物关联查询、同名人物筛选、指代模糊推理
   201   202   203   204   205   206   207   208   209   210   211