Page 306 - 《软件学报》2026年第1期
P. 306
刘立伟 等: 数据要素流通全流程隐私关键技术: 现状、挑战与展望 303
零知识证明是密码学技术在数据隐私领域中的代表性成果; 而近年来兴起的联邦学习研究则是合作学习技术的代
表, 契合数据流通中普遍存在多个主体的分布式情形; 区块链是数字经济的重要基础设施, 其数据不可篡改性在金
融交易、合同管理和知识产权保护等领域具有重要价值. 数据流通后主要包括数据治理环节, 研究数据使用后的
安全性以及被遗忘权等问题, 目前的代表研究是忘却学习, 旨在使模型能够有选择地“忘记”某些特定的数据或知
识. 在某些情况下, 用户可能要求删除其个人数据, 忘却学习技术可以确保模型在删除这些数据后, 不再保留或利
用这些数据的任何信息.
数据流通前
数据最小化 数字水印
水平 传统水印
预 数据最小化 目的限制 合
保 原则 模型无关水印 规
护 性
垂直 模型相关水印
数据最小化
数据流通
安 基于密码学 基于合作学习 基于区块链 安
全 全
流 同态加密 联邦学习 性能瓶颈 性
通 差分隐私
跨链数据流通
安全多方计算 个性化 传统
联邦 联邦 联合数据共享
零知识证明
权 数据流通后 可
责 遗
闭 忘却学习 忘
环 精确忘却学习 性
集中式
忘却学习
非精确忘却学习
被遗忘权
客户端级别
联邦
忘却学习 样本级别
类型级别
图 1 数据流通全流程隐私关键技术一览
本工作以数据流通为载体, 隐私技术为对象的综述类论文, 将数据最小化原则、联邦学习、区块链等新兴技
术纳入研究范畴, 全面涵盖数据流通全过程, 有利于研究者快速建立对数据流通全流程隐私技术的系统认识, 为后
续研究建立完备的全流程数据流通隐私保护范式奠定基础.
本文第 1 节介绍数据流通 3 个阶段的隐私风险和相关前沿技术. 第 2 节介绍数据流通前的隐私技术分类体
系, 包括数据最小化原则和数字水印技术. 第 3 节依据技术基础从 3 个方向介绍数据流通阶段的隐私研究进展与
挑战, 范围涵盖密码学、合作学习与区块链. 第 4 节介绍数据流通后以忘却学习为代表的隐私保护技术. 第 5 节介
绍人工智能时代下数据流通的全新隐私挑战. 最后总结全文.

