Page 200 - 《软件学报》2025年第12期
P. 200

吴信东 等: 华谱通: 基于知识推理的家谱问答大语言模型                                                    5581


























                                            图 6 ChatGPT  对多条路径的错误归纳案例

                    为了应对大模型难以有效理解关系路径的问题, 本文对人物关系路径的检索过程做了进一步优化, 包括基于
                 路径衰减的关系打分机制和基于大根堆的               Dijkstra 路径排序算法, 旨在检索到最能代表人物关系的路径来启发大
                 模型回答用户问题.
                    关系分数是路径打分和排序的基础. 华谱通根据家谱中以“父子妻女”关系为核心的特性, 对第                              2.2  节中定义
                 的  26  种关系设计了层次打分规则. 如图        7  所示, 华谱通以“父亲”“儿子”“母亲”“女儿”“丈夫”和“妻子”为一个家庭
                 的中心关系, 并向外扩展到兄弟姐妹、叔伯姑侄以及爷孙三组关系                      (图  7  中蓝色箭头关联的表格); 此外, 华谱通还
                 针对一些模糊的关系进行了打分            (图  7  中红色箭头关联的表格). 因为模糊关系检索的结果不及其他关系精准, 华
                 谱通定义的模糊关系分数远低于其他关系.


                                                       关系   父母/子女
                                                       分数      3

                                              关系   父亲/儿子    母亲/女儿    丈夫/妻子
                                              分数      9        8        7


                        关系    哥哥/弟弟/姐姐/妹妹        关系    伯伯/叔叔/姑姑/侄子/侄女        关系   爷爷/孙子    奶奶/孙女
                        分数          7            分数            5             分数      8        6

                        关系   兄弟/姐妹    弟兄姐妹                                       关系    祖先/后代
                        分数      2        1                                       分数      4
                                                     图 7 层次关系打分

                    除了关系分数之外, 路径的长度是路径打分的另一个重要参考. 一般来说, 两个人之间的关系路径越长, 代表
                 两人的关系越薄弱. 因此本文规定一个关系在路径的分数随着跳数的增加而减少. 具体的分数衰减原则如下.
                    1) 对任意关系, 其分数随其所在路径位置跳数的增加而递减. 以图                   7  中的“父亲”关系为例, 当处于路径的一跳
                 位置时, 其分数为     10  分. 二跳位置的“父亲”关系分数要小于         10  分, 三跳位置的“父亲”关系分数则要小于二跳位置
                 的“父亲”关系分数, 依次类推.
   195   196   197   198   199   200   201   202   203   204   205