Page 210 - 《软件学报》2025年第12期
P. 210
吴信东 等: 华谱通: 基于知识推理的家谱问答大语言模型 5591
于智谱清言在第 2 轮问答中误将曾国潢作为曾广銮的爷爷, 华谱通在明确问题中的“他”代指曾广銮之后, 仍然会
执行一次家谱图谱查询的操作. 因此, 华谱通能够在多轮问答中同时利用历史问答记录和家谱逻辑查询结果来增
加大模型生成正确答案的概率.
(a) 华谱通 (b) 智谱清言
图 16 华谱通和智谱清言指代模糊问答场景
3.3.3 跨家谱问答
为验证第 2.5 节所述的跨家谱问答技术路线的有效性, 本节分别从婚姻关系和社会关系两个场景来展示华谱
通中逻辑推理式和关系生成式跨家谱问答模块的问答结果.
图 17 展示了华谱通和智谱清言在跨谱婚姻关系上的问答质量. 由于目前华谱系统中并未收集“陈彰绶”所在
的陈氏家谱, 本文以《曾国藩家谱》中的“陈彰绶” (如图 14 所示) 作为跨谱问答的目标人物. 如问答结果所示, 尽
管华谱通和智谱清言都能够回答出“曾纪泽和陈彰绶是亲家”这一关系, 但是智谱清言在利用大模型进行文档检索
与语义理解时误将“曾广阳”当作“曾广銮”, 导致其提供的推理依据出现错误. 相比之下, 华谱通可以利用 Jena 规则
推理出的可解释人物关系路径“曾纪泽→曾广銮 (儿子)→陈氏 (妻子)→陈彰绶 (父亲)”更直观地引导大模型进行关
系总结, 从而提供准确的人物关系和推理依据.
曾国藩家谱 智谱清言
曾纪泽和陈彰绶什么关系? 发送
(a) 华谱通 (b) 智谱清言
图 17 华谱通和智谱清言跨家谱问答场景 (婚姻关系)
图 18 展示了华谱通和智谱清言在社会关系方面的问答质量. 为了验证华谱通对无关联家谱人物之间的关系
生成能力, 本文选择了两份公开的无关联家谱 (《杨氏—都阳谱》与《曾国藩家谱》) 进行跨谱问答. 在具体问答
场景中, 用户提问“曾广銮和杨仲儒什么关系?”, 智谱清言首先检索并获取《曾国藩家谱》和《杨氏—都阳谱》中
与二人有关的信息, 再通过大模型对检索结果进行总结. 由于两份家谱之间不存在有确定关联的人物, 智谱清言所
回答的结果实际上是正确的. 相比之下, 为了体现华谱“人人互联”的特点, 华谱通设计了一种基于祖先年代匹配的
模糊推理机制, 通过检索二人之间生活年代最接近的祖先或后代, 引导大模型生成模糊的社会关系. 根据图 18 的
结果可以看出, 尽管曾广銮和杨仲儒之间没有确定关系, 但是华谱通生成了一条“曾纪泽 (曾广銮之父) 和杨仲儒生
活于同一时期”的关系路径, 从而实现了曾广銮和杨仲儒之间关联, 这体现了华谱通在跨谱人物关联方面问答结果
的多样性.

