Page 191 - 《软件学报》2025年第12期
P. 191

软件学报 ISSN 1000-9825, CODEN RUXUEW                                        E-mail: jos@iscas.ac.cn
                 2025,36(12):5572−5598 [doi: 10.13328/j.cnki.jos.007399] [CSTR: 32375.14.jos.007399]  http://www.jos.org.cn
                 ©中国科学院软件研究所版权所有.                                                          Tel: +86-10-62562563



                                                                        *
                 华谱通: 基于知识推理的家谱问答大语言模型

                 吴信东  1,2 ,    卓兴锐  1,2 ,    常永泮  1,2 ,    吴共庆  1,2 ,    张    赞  1,2 ,    朱    毅  2,3


                 1
                  (大数据知识工程教育部重点实验室 (合肥工业大学), 安徽 合肥 230009)
                 2
                  (合肥工业大学 计算机与信息学院, 安徽 合肥 230601)
                 3
                  (扬州大学 信息工程学院, 江苏 扬州 225009)
                 通信作者: 吴信东, E-mail: xwu@hfut.edu.cn

                 摘 要: 利用计算机技术实现家谱数据的智能化管理, 对传承和普及中华传统文化有着重要的意义. 近年来, 随着
                 基于检索增强的大语言模型在知识问答领域被广泛应用, 通过大语言模型以对话的方式向用户展示多样的家谱文
                 化已经成为一个备受关注的研究方向. 然而, 家谱数据的异构性、自治性、复杂性和演化性导致现有的知识检索
                 框架难以在复杂的家谱信息中实现完备的知识推理. 针对上述问题, 提出一种基于知识图谱推理的大语言模型家
                 谱问答系统——华谱通, 从推理逻辑完备性和信息筛选精准性两个方面, 构建适合大语言模型家谱问答的知识图
                 谱推理框架. 在推理逻辑完备性方面, 以知识图谱作为家谱知识的载体, 并基于                       Jena 框架提出一套完备的家谱知识
                 推理规则, 以提升模型对家谱信息的检索召回率. 在信息筛选方面, 以家谱中的同名人物和多重亲属关系为场景,
                 提出基于问题-条件三元组的多条件匹配机制和基于大根堆的                      Dijkstra 路径排序算法, 通过过滤冗余的检索信息,
                 达到对大语言模型精准提示的目的. 目前, 华谱通已经部署到公开的智能家谱网站——华谱网, 并通过真实的家谱
                 数据验证了问答系统的有效性.
                 关键词: 家谱知识问答; 知识图谱推理; 大语言模型; 多条件匹配; 路径排序
                 中图法分类号: TP182

                 中文引用格式: 吴信东,  卓兴锐,  常永泮,  吴共庆,  张赞,  朱毅.  华谱通:  基于知识推理的家谱问答大语言模型.  软件学报,  2025,
                 36(12): 5572–5598. http://www.jos.org.cn/1000-9825/7399.htm
                 英文引用格式: Wu  XD,  Zhuo  XR,  Chang  YP,  Wu  GQ,  Zhang  Z,  Zhu  Y.  Huaputong:  Large  Language  Model  for  Genealogical
                 Question-answering with Knowledge Reasoning. Ruan Jian Xue Bao/Journal of Software, 2025, 36(12): 5572–5598 (in Chinese). http://
                 www.jos.org.cn/1000-9825/7399.htm

                 Huaputong: Large Language Model for Genealogical Question-answering with Knowledge
                 Reasoning
                           1,2            1,2             1,2           1,2         1,2     2,3
                 WU Xin-Dong , ZHUO Xing-Rui , CHANG Yong-Pan , WU Gong-Qing , ZHANG Zan , ZHU Yi
                 1
                 (Key Laboratory of Knowledge Engineering with Big Data (Hefei University of Technology), Ministry of Education, Hefei 230009, China)
                 2
                 (School of Computer Science and Information Engineering, Hefei University of Technology, Hefei 230601, China)
                 3
                 (School of Information Engineering, Yangzhou University, Yangzhou 225009, China)
                 Abstract:  The  use  of  computer  technology  for  intelligent  management  of  genealogy  data  plays  a  significant  role  in  inheriting  and
                 popularizing  Chinese  traditional  culture.  In  recent  years,  with  the  widespread  application  of  retrieval-augmented  large  language  model
                 (LLM)  in  the  knowledge  question-answering  (Q&A)  field,  presenting  diverse  genealogy  scenarios  to  users  through  dialogues  with  LLMs
                 has  become  a  highly  anticipated  research  direction.  However,  the  heterogeneity,  autonomy,  complexity,  and  evolution  (HACE)
                 characteristics  of  genealogy  data  pose  challenges  for  existing  knowledge  retrieval  frameworks  to  perform  comprehensive  knowledge


                 *    基金项目: 国家自然科学基金  (62120106008); 教育部创新团队发展计划  (IRT17R32); 中央高校基本科研业务费专项资金  (JZ2023HGTB0270)
                  收稿时间: 2024-06-27; 修改时间: 2024-08-26; 采用时间: 2025-01-23; jos 在线出版时间: 2025-06-25
                  CNKI 网络首发时间: 2025-06-26
   186   187   188   189   190   191   192   193   194   195   196