Page 205 - 《软件学报》2025年第12期
P. 205
5586 软件学报 2025 年第 36 卷第 12 期
中, 以便后续的问答使用.
根据上述的两个模块, 华谱通可以充分利用异步请求响应机制, 在规定时间内为用户返回一个答案, 避免用户
因系统响应过慢而导致不理想的使用体验.
2.7 华谱通数据隐私保护
华谱通问答系统以华谱平台为基座进行功能开发, 因此, 华谱通遵循华谱平台对家谱数据的访问权限管理框
架 [3] , 以实现问答过程中的家谱数据隐私保护. 此外, 由于华谱通在问答过程中只会获取华谱平台上用户的注册
ID 编号, 且相关的大模型提示模板中没有使用用户的详细信息 (例如姓名、性别和联系方式等), 这可以保证在问
答过程中不会泄露系统中的用户画像. 因此, 下文主要针对家谱数据的访问权限, 分析华谱通数据隐私保护机制的
设计细节.
图 10(a) 展示了华谱平台对家谱数据的访问权限控制方案. 总体而言, 华谱平台将家谱的可访问等级划分为
“公开”“共建”“私有”这 3 级, 并将用户划分为“游客/普通用户”“家谱共建者”“家谱创建者”“系统管理员”这 4 类进
行对应. 在不考虑修改家谱信息的前提下, 我们以家谱创建者为例阐述该权限控制方案: 一个注册并登录的华谱用
户, 可以进入“家谱建设”模块录入家谱信息并设置家谱可访问等级. 当可访问等级设置为“公开家谱”时, 该家谱的
信息被所有人可见; 当为“共建家谱”时, 该家谱仅能被创建者和指定的共建者访问; 同理, 私有家谱仅由创建者可
见; 而后台系统管理员对所有家谱都有访问权限. 需要注意的是, “游客/普通用户”“家谱共建者”“家谱创建者”这 3
类用户的角色会根据具体家谱的可访问等级而发生改变, 这能保证每份家谱只对符合访问权限的用户可见, 进而
预防家谱信息泄露的隐患.
家谱类型
用户 用户提问
家谱设置 问答家谱选择
注册/登录
家谱数据
用 可见家谱列表
户
公开家谱 共建家谱 私有家谱 访问权限 权 限 逻辑推理机部署
共建人员 识
别
家谱RDF文件
数据存储
Jena推理规则
用户与家谱权限
人机交互接口设计
家谱人物关系信息
大模型接口
功能展示
功能展示
• 华谱通
• 家谱查询 • 人物信息问答
• 人物关联 • 人物关系问答
游客/普通用户 家谱共建者 家谱创建者 系统管理员 … …
用户类型 华谱平台 华谱通
(a) 华谱平台用户与家谱访问权限 (b) 华谱通调用华谱数据权限管理功能
图 10 华谱平台用户与数据访问权限设计与华谱通调用情况
在此基础上, 华谱通中用户可访问的家谱数据也遵循上述权限控制方案. 如图 10(b) 所示, 在用户登录华谱平
台时, 后台系统会自动检测该用户可访问的家谱信息, 并整合为一份“可见家谱列表”. 当用户进入华谱通问答模块
后, 该“可见家谱列表”会映射到前端的“选择家谱”区域 (参考图 11), 因此, 用户在华谱通界面中只能选择“可见家
谱列表”中的家谱进行问答, 而不会访问到权限以外的家谱. 此外, 为防止大模型在多线程问答过程中出现家谱数
据泄露的问题, 华谱通通过用户 ID 来唯一标识当前用户对应的线程. 在处理当前用户的问题时, 华谱通只允许大
模型访问该用户 ID 对应线程内的历史问答记录, 并全称跟踪该线程直至该用户退出或刷新问答界面. 通过上述华
谱平台数据访问权限设置和问答过程中的线程标记法, 华谱通可以从用户操作和大模型问答两个角度实现数据保
护, 避免了家谱中隐私信息的泄露问题.

