Page 200 - 《软件学报》2025年第12期
P. 200
吴信东 等: 华谱通: 基于知识推理的家谱问答大语言模型 5581
图 6 ChatGPT 对多条路径的错误归纳案例
为了应对大模型难以有效理解关系路径的问题, 本文对人物关系路径的检索过程做了进一步优化, 包括基于
路径衰减的关系打分机制和基于大根堆的 Dijkstra 路径排序算法, 旨在检索到最能代表人物关系的路径来启发大
模型回答用户问题.
关系分数是路径打分和排序的基础. 华谱通根据家谱中以“父子妻女”关系为核心的特性, 对第 2.2 节中定义
的 26 种关系设计了层次打分规则. 如图 7 所示, 华谱通以“父亲”“儿子”“母亲”“女儿”“丈夫”和“妻子”为一个家庭
的中心关系, 并向外扩展到兄弟姐妹、叔伯姑侄以及爷孙三组关系 (图 7 中蓝色箭头关联的表格); 此外, 华谱通还
针对一些模糊的关系进行了打分 (图 7 中红色箭头关联的表格). 因为模糊关系检索的结果不及其他关系精准, 华
谱通定义的模糊关系分数远低于其他关系.
关系 父母/子女
分数 3
关系 父亲/儿子 母亲/女儿 丈夫/妻子
分数 9 8 7
关系 哥哥/弟弟/姐姐/妹妹 关系 伯伯/叔叔/姑姑/侄子/侄女 关系 爷爷/孙子 奶奶/孙女
分数 7 分数 5 分数 8 6
关系 兄弟/姐妹 弟兄姐妹 关系 祖先/后代
分数 2 1 分数 4
图 7 层次关系打分
除了关系分数之外, 路径的长度是路径打分的另一个重要参考. 一般来说, 两个人之间的关系路径越长, 代表
两人的关系越薄弱. 因此本文规定一个关系在路径的分数随着跳数的增加而减少. 具体的分数衰减原则如下.
1) 对任意关系, 其分数随其所在路径位置跳数的增加而递减. 以图 7 中的“父亲”关系为例, 当处于路径的一跳
位置时, 其分数为 10 分. 二跳位置的“父亲”关系分数要小于 10 分, 三跳位置的“父亲”关系分数则要小于二跳位置
的“父亲”关系分数, 依次类推.

