Page 203 - 《软件学报》2025年第12期
P. 203

5584                                                      软件学报  2025  年第  36  卷第  12  期



                                    华谱系统致力于为华夏写史, 助百姓寻根。期待和大家共同打造全球最大
                                    最全的跨姓华人家谱系统——中华之谱!
                                    华谱通是华谱系统的特色应用之一, 能够结合家谱中的信息来解答用户关
                                    于找人、找关系的问题。此外, 华谱通也支持日常的聊天功能。
                                    当前家谱信息如下:
                                    【导入具体家谱简介信息】
                                    你现在是一个华谱通小助手, 请根据提供的附加信息, 回答用户的问题。
                                    ========================第1轮问答========================
                                    问题: xxxxxx
                                    回答: xxxxxx
                                    ========================第2轮问答========================
                                    问题: xxxxxx
                                    回答: xxxxxx
                                    …
                                    ======================当前用户问题=======================
                                    问题: 【导入用户当前问题】
                                    附加信息: 【导入家谱图谱检索信息】
                                    回答:

                                                   图 8 多轮问答提示模板

                  2.5   跨家谱问答技术路线分析

                    在华谱系统中, 除了家谱内的亲属关系, 还存在跨谱关系. 这些关系可以实现家谱之间的连接, 从而构建更加
                 复杂的跨家谱人物关系网. 本节主要针对婚姻关系和社会关系, 从逻辑推理和关系生成两个角度对华谱通跨家谱
                 问答的技术路线进行总体分析.
                    ● 逻辑推理式跨家谱问答: 逻辑推理式跨家谱问答适用于跨谱的婚姻关系. 如第                        2.1  节所述, 两个家族的成员
                 会通过夫妻双方实现关系互联. 具体而言, 婚姻关系可以根据第                   2.2  节提供的  26  种关系推理规则进行扩展. 例如,
                 “岳父”关系和“亲家”关系的        Jena 推理规则可以被分别定义为“(?a : 妻子 ?b) (?b : 父亲 ?c)→(?a : 岳父 ?c)”和“(?a :
                 子女 ?b) (?b : 夫妻 ?c) (?c : 父母 ?d)→(?a : 亲家 ?d)”. 在此基础上, 基于婚姻关系的跨家谱知识推理结果可以被直
                 接用于后续的信息筛选        (第  2.3  节) 和多轮问答  (第  2.4  节). 因此, 当前的华谱通技术框架可以快速地实现基于婚姻
                 关系的跨家谱问答功能        (具体案例参考第      3.3.3  节).
                    ● 关系生成式跨家谱问答: 这种问答方式主要针对人物之间的社会关系. 社会关系需要考虑家谱人物的生平
                 经历和所处的时代背景. 因此, 相较于亲属关系有明确的规则定义, 人物之间的社会关系则显得更加复杂多样. 例
                 如, 在镇压太平天国运动的背景下, 曾国藩和李鸿章存在“战友”“师生”等社会关系; 而在晚清朝堂上, 二人的社会
                 关系则变为“同僚”或“上下级”. 此外, 当被查询的二人不属于同一个时代时, 对应的社会关系则表现得更加微弱.
                 例如, 在查询李四     (1998  年生于西安市) 与李鸿章的关系时, 可以认为二人是“同姓”关系, 也可以尝试检索出与李
                 鸿章生活在同一时代的李四的某个祖先. 因此, 参考婚姻关系的                    Jena 规则定义法是难以涵盖所有社会关系的. 在
                 这种情况下, 目前一个可行的思路是对待查询二人的个人和亲属信息进行粗粒度地检索, 并利用大模型的自然语
                 言理解能力和知识涌现能力, 从候选的检索结果中选择性地推理出与查询语句相关的社会关系                                (具体案例参考第
                 3.3.3  节).
                    在实际问答过程中, 由于无法预判被查询人物之间的关系类型, 华谱通采取多线程的方式并行执行上述两个
                 跨家谱问答模块. 逻辑推理式跨家谱问答能够提供精准的人物关系, 但需要对多种关系的多跳组合进行耗时的排
                 序和遍历. 相比之下, 尽管关系生成式跨家谱问答模块中的大模型所推理出的人物关系存在模糊性, 但响应速度
                 快. 因此, 在规定时间内请求不到逻辑推理式跨家谱问答模块的答案时                     (可以认为被查询的二人之间关系薄弱或没
                 有实际关联), 华谱通会调用关系生成式跨家谱问答模块中的答案, 以实现及时的人机交互.
                  2.6   系统异步请求响应机制
                    在实际人物关联问答时, 用户可能会提供关系薄弱                 (如第  2.5  节中所介绍的关系生成式跨家谱问答场景) 或不
                 存在于选定家谱中的待查询人物, 这会大大增加系统在路径选择上的时间开销, 进而导致系统响应超时的问题. 因
   198   199   200   201   202   203   204   205   206   207   208