Page 323 - 《软件学报》2026年第1期
P. 323
320 软件学报 2026 年第 37 卷第 1 期
小化原则、个性化联邦学习、忘却学习等多项新兴研究领域. 通过本文, 研究者可以更加全面地认识数据流通全
流程, 建立系统的技术分类框架, 从而为后续建立完备的全流程数据流通隐私保护范式奠定基础.
表 3 数据要素流通全阶段隐私关键技术对比
流通阶段 技术类型 适用场景 优势 劣势 主要挑战
数据收集阶段, 如 有效降低数据泄露风 限制数据后续分析价 缺乏统一的数据最小化形
涉 及 敏 感 数 据 、 险, 减少数据存储成本, 值, 依赖对数据需求的 式定义; 难以平衡数据效用
数据最小化
合规性要求高的 符合GDPR等隐私保护 精准预判; 法规到技术 与最小化, 动态业务中需求
医疗、金融领域 法规的数据采集规范 实践存在一定鸿沟 预测困难
数据流通前
鲁棒的水印算法设计, 避免
水印可能被去除或破
版权追踪、数据 不破坏数据可用性, 隐 水印嵌入引入额外的信息
数字水印 坏, 鲁棒性高度依赖算
可信溯源 蔽性强, 支持事后追责 泄露风险; 欠缺对数据集版
法设计
权的关注
数据流通中的计 支持在密文上进行数
同态加密 算阶段, 如云端数 学计算, 实现端到端隐 计算开销大, 仅支持有 性能优化与算法可扩展性
限运算, 密钥管理复杂
据分析 私保护
更好地权衡隐私预算与数
数据发布与共享, 噪声添加降低数据精
差分隐私 如银行统计报表 提供可证明的隐私保 度, 影响模型性能, 需 据效用; 差分隐私对其他攻
证, 抵御背景知识攻击
击方式的防御缺乏理论与
基于密 生成 合理规划隐私预算. 实验验证
码学
安全多方 多方数据联合计 数据无需出域, 支持隐 通信开销高, 计算效率 抵御合谋攻击, 优化大规模
算, 如联合风控、
计算 私保护下的协同计算 低, 协议设计复杂 场景下的协议性能
精准营销
数据验证场景, 如
零知识 验证过程不泄露原始 证明生成过程的计算 设计更加通用的零知识证
数据流通 证明 身份认证、交易 信息, 高效轻量 复杂, 适用场景有限 明协议
合规性证明
分布式模型训练, 通信成本高, 模型易受
传统 如跨医院医疗模 数据不出本地, 降低集 推理攻击, 异构数据兼 防御模型反演、成员推断
联邦 中泄露风险 攻击, 优化跨域数据对齐
型训练 容性差
基于合作 用户需求差异大 兼顾全局模型与本地 防止本地个性化参数泄露
学习 个性化 的分布式训练场 特征, 提升模型在异质 端云协调复杂度更高, 用户数据分布; 防止恶意用
联邦 数据上的性能, 更加贴 隐私泄露风险分散化 户在个性化训练阶段植入
景, 如个性化推荐
合现实场景 后门
在不侵犯用户隐私的前提
存储成本高, 吞吐量低,
数据存证与溯源, 数据不可篡改, 去中心 下进行数据跨链传输; 解决
区块链 链上数据公开导致隐
如供应链审计 化透明监管 海量数据上链交易的效率
私风险
瓶颈
残留信息难以彻底清 量化数据擦除效果; 减少忘
集中式忘 中心化数据中心 可以直接操作模型参 除, 可能影响模型性能; 却学习带来的性能损失; 防
却学习 的数据删除需求 数, 删除效率高 模型重训练可能带来 御 基 于 残 留 信 息 的 重 建
忘却
数据流通后 高昂代价 攻击
学习
联邦忘却 分布式环境下的 无需集中数据, 符合数 协调成本高, 删除一致 解决联邦忘却学习中的性
数据删除, 如多机
学习 据本地化要求 性难保证 能退化问题
构协作场景
References
[1] Li FH, Li H, Jia Y, Yu NH, Weng J. Privacy computing: Concept, connotation and its research trend. Journal on Communications, 2016,
37(4): 1–11 (in Chinese with English abstract). [doi: 10.11959/j.issn.1000-436x.2016078]
[2] Guo ZJ, Li ML, Zhou YM, Peng WL, Li S, Qian ZX, Zhang XP. Survey on digital watermarking technology for artificial intelligence
generated content models. Journal of Cybersecurity, 2024, 2(1): 13–39 (in Chinese with English abstract). [doi: 10.20172/j.issn.2097-
3136.240102]
[3] Liu AW, Pan LY, Lu YJ, Li JJ, Hu XM, Zhang X, Wen LJ, King I, Xiong H, Yu P. A survey of text watermarking in the era of large
language models. ACM Computing Surveys, 2024, 57(2): 47. [doi: 10.1145/3691626]

