Page 306 - 《软件学报》2026年第1期
P. 306

刘立伟 等: 数据要素流通全流程隐私关键技术: 现状、挑战与展望                                                 303


                 零知识证明是密码学技术在数据隐私领域中的代表性成果; 而近年来兴起的联邦学习研究则是合作学习技术的代
                 表, 契合数据流通中普遍存在多个主体的分布式情形; 区块链是数字经济的重要基础设施, 其数据不可篡改性在金
                 融交易、合同管理和知识产权保护等领域具有重要价值. 数据流通后主要包括数据治理环节, 研究数据使用后的
                 安全性以及被遗忘权等问题, 目前的代表研究是忘却学习, 旨在使模型能够有选择地“忘记”某些特定的数据或知
                 识. 在某些情况下, 用户可能要求删除其个人数据, 忘却学习技术可以确保模型在删除这些数据后, 不再保留或利

                 用这些数据的任何信息.

                                                         数据流通前

                                              数据最小化                  数字水印

                                           水平                       传统水印
                              预          数据最小化       目的限制                                 合
                              保                       原则           模型无关水印                 规
                              护                                                           性
                                           垂直                      模型相关水印
                                         数据最小化




                                                          数据流通

                              安         基于密码学           基于合作学习           基于区块链            安
                              全                                                           全
                              流          同态加密            联邦学习             性能瓶颈            性
                              通          差分隐私
                                                                        跨链数据流通
                                       安全多方计算         个性化      传统
                                                       联邦      联邦       联合数据共享
                                        零知识证明



                              权                          数据流通后                            可
                              责                                                           遗
                              闭                           忘却学习                            忘
                              环                                       精确忘却学习              性
                                                          集中式
                                                         忘却学习
                                                                     非精确忘却学习
                                            被遗忘权
                                                                      客户端级别
                                                           联邦
                                                         忘却学习          样本级别
                                                                       类型级别

                                             图 1 数据流通全流程隐私关键技术一览

                    本工作以数据流通为载体, 隐私技术为对象的综述类论文, 将数据最小化原则、联邦学习、区块链等新兴技
                 术纳入研究范畴, 全面涵盖数据流通全过程, 有利于研究者快速建立对数据流通全流程隐私技术的系统认识, 为后
                 续研究建立完备的全流程数据流通隐私保护范式奠定基础.
                    本文第   1  节介绍数据流通     3  个阶段的隐私风险和相关前沿技术. 第           2  节介绍数据流通前的隐私技术分类体
                 系, 包括数据最小化原则和数字水印技术. 第             3  节依据技术基础从     3  个方向介绍数据流通阶段的隐私研究进展与
                 挑战, 范围涵盖密码学、合作学习与区块链. 第             4  节介绍数据流通后以忘却学习为代表的隐私保护技术. 第                 5  节介
                 绍人工智能时代下数据流通的全新隐私挑战. 最后总结全文.
   301   302   303   304   305   306   307   308   309   310   311