Page 191 - 《软件学报》2025年第12期
P. 191
软件学报 ISSN 1000-9825, CODEN RUXUEW E-mail: jos@iscas.ac.cn
2025,36(12):5572−5598 [doi: 10.13328/j.cnki.jos.007399] [CSTR: 32375.14.jos.007399] http://www.jos.org.cn
©中国科学院软件研究所版权所有. Tel: +86-10-62562563
*
华谱通: 基于知识推理的家谱问答大语言模型
吴信东 1,2 , 卓兴锐 1,2 , 常永泮 1,2 , 吴共庆 1,2 , 张 赞 1,2 , 朱 毅 2,3
1
(大数据知识工程教育部重点实验室 (合肥工业大学), 安徽 合肥 230009)
2
(合肥工业大学 计算机与信息学院, 安徽 合肥 230601)
3
(扬州大学 信息工程学院, 江苏 扬州 225009)
通信作者: 吴信东, E-mail: xwu@hfut.edu.cn
摘 要: 利用计算机技术实现家谱数据的智能化管理, 对传承和普及中华传统文化有着重要的意义. 近年来, 随着
基于检索增强的大语言模型在知识问答领域被广泛应用, 通过大语言模型以对话的方式向用户展示多样的家谱文
化已经成为一个备受关注的研究方向. 然而, 家谱数据的异构性、自治性、复杂性和演化性导致现有的知识检索
框架难以在复杂的家谱信息中实现完备的知识推理. 针对上述问题, 提出一种基于知识图谱推理的大语言模型家
谱问答系统——华谱通, 从推理逻辑完备性和信息筛选精准性两个方面, 构建适合大语言模型家谱问答的知识图
谱推理框架. 在推理逻辑完备性方面, 以知识图谱作为家谱知识的载体, 并基于 Jena 框架提出一套完备的家谱知识
推理规则, 以提升模型对家谱信息的检索召回率. 在信息筛选方面, 以家谱中的同名人物和多重亲属关系为场景,
提出基于问题-条件三元组的多条件匹配机制和基于大根堆的 Dijkstra 路径排序算法, 通过过滤冗余的检索信息,
达到对大语言模型精准提示的目的. 目前, 华谱通已经部署到公开的智能家谱网站——华谱网, 并通过真实的家谱
数据验证了问答系统的有效性.
关键词: 家谱知识问答; 知识图谱推理; 大语言模型; 多条件匹配; 路径排序
中图法分类号: TP182
中文引用格式: 吴信东, 卓兴锐, 常永泮, 吴共庆, 张赞, 朱毅. 华谱通: 基于知识推理的家谱问答大语言模型. 软件学报, 2025,
36(12): 5572–5598. http://www.jos.org.cn/1000-9825/7399.htm
英文引用格式: Wu XD, Zhuo XR, Chang YP, Wu GQ, Zhang Z, Zhu Y. Huaputong: Large Language Model for Genealogical
Question-answering with Knowledge Reasoning. Ruan Jian Xue Bao/Journal of Software, 2025, 36(12): 5572–5598 (in Chinese). http://
www.jos.org.cn/1000-9825/7399.htm
Huaputong: Large Language Model for Genealogical Question-answering with Knowledge
Reasoning
1,2 1,2 1,2 1,2 1,2 2,3
WU Xin-Dong , ZHUO Xing-Rui , CHANG Yong-Pan , WU Gong-Qing , ZHANG Zan , ZHU Yi
1
(Key Laboratory of Knowledge Engineering with Big Data (Hefei University of Technology), Ministry of Education, Hefei 230009, China)
2
(School of Computer Science and Information Engineering, Hefei University of Technology, Hefei 230601, China)
3
(School of Information Engineering, Yangzhou University, Yangzhou 225009, China)
Abstract: The use of computer technology for intelligent management of genealogy data plays a significant role in inheriting and
popularizing Chinese traditional culture. In recent years, with the widespread application of retrieval-augmented large language model
(LLM) in the knowledge question-answering (Q&A) field, presenting diverse genealogy scenarios to users through dialogues with LLMs
has become a highly anticipated research direction. However, the heterogeneity, autonomy, complexity, and evolution (HACE)
characteristics of genealogy data pose challenges for existing knowledge retrieval frameworks to perform comprehensive knowledge
* 基金项目: 国家自然科学基金 (62120106008); 教育部创新团队发展计划 (IRT17R32); 中央高校基本科研业务费专项资金 (JZ2023HGTB0270)
收稿时间: 2024-06-27; 修改时间: 2024-08-26; 采用时间: 2025-01-23; jos 在线出版时间: 2025-06-25
CNKI 网络首发时间: 2025-06-26

