Page 257 - 《软件学报》2020年第11期
P. 257
3572 Journal of Software 软件学报 Vol.31, No.11, November 2020
relevant keys from the owner to upgrade the data quality grade. The watermark in relational data with any data quality grade is sufficient
to prove the copyright. Flexible watermark reversion is achieved via partitioned auxiliary data design. A more practical mechanism is
devised to efficiently handle the hash table collision, which reduces both computational and storage overhead. Experiments on algorithms
and watermark show that the proposed scheme is feasible and robust.
Key words: watermark; graded reversible; copyright; relational data
[1]
随着大数据时代的到来,数据已经渗透到各行各业,成为重要的生产因素 .数据价值的不断提升,让人们越
来越关心版权保护问题.关系数据是常用的数据类型之一,普遍用于数据分析和数据交流.某些人可能在未经授
权的情况下对数据进行恶意复制来获取经济利益,因此,关系数据的版权保护问题成为该领域的研究热点之一.
[2]
数字水印技术作为信息隐藏技术的一个重要分支,是实现版权保护的有效方法 .数字水印技术最初被应
用于音频、图像和视频等多媒体数据的版权保护 [3−6] .2002 年,IBM Almaden 研究中心的 Agrawal 等人以及美国
Purdue 大学的 Sion 等人结合关系数据的特点,提出了关系数据数字水印技术 [7,8] .该技术的基本原理是将一些标
识信息添加到原数据中,在不影响数据正常使用的前提下,达到声明版权的目的.这些标识信息构成了数字水
印,但是标识信息的嵌入势必会导致永久性的数据失真,对数据可用性造成永久性损害.如果数据可用性无法满
[9]
足使用者的要求,水印嵌入将导致数据失去使用价值 .针对上述问题,关系数据可逆数字水印技术开始受到研
究者们的广泛关注.
关系数据可逆水印技术不仅可以执行水印嵌入操作,还可以执行水印嵌入的逆操作,即将嵌入到数据中的
水印去除,实现数据恢复.但是现有的关系数据可逆水印技术在实际应用中仍存在问题.假设 Alice 为数据所有
者,Bob 为使用者.Alice 为证明对数据的版权,在出售或分发数据前,使用关系数据可逆水印技术对数据进行水
印嵌入.Bob 在使用该数据时发现其可用性无法满足他的要求,便向 Alice申请或购买相关密钥,执行水印嵌入的
逆操作,消除数据中的水印,提高数据的可用性.此时,若 Bob 在未经 Alice 授权的情况下将恢复后的数据出售给
他人,Alice 将无法从该数据中检测出水印,证明数据的版权.根据上述的应用场景,现有的关系数据可逆水印技
术虽可以恢复原始数据,将数据可用性提升到水印嵌入之前的程度,但所有者将不能继续证明对该数据的版权.
出现该问题的原因是:现有的关系数据可逆水印技术对数据恢复的程度缺乏控制,只能将数据中的水印全部去
除.因此,如何在提升数据可用性的同时实现数据的版权保护成为新的研究方向.
本文针对现有的关系数据可逆水印方案中存在的问题,提出了一种分级可逆的关系数据水印方案,定义了
数据质量等级来反映数据的可用性,设计了用于实现分级可逆水印的分区嵌入、等级检测、水印检测以及等级
提升等算法.数据所有者对数据进行分发或出售前,先使用水印分区嵌入算法对数据进行水印嵌入,该过程在嵌
入水印的同时,会预设若干数据质量等级.如果数据使用者对当前数据的可用性不满意,可先检测当前数据质量
等级,然后向数据所有者申请或购买相关密钥,从而去除部分数据分区中的水印,对数据质量等级进行提升,按
需增强数据的可用性.此后,如果数据的使用者在未经过所有者授权的情况下分发该数据,所有者仍然可以从数
据中检测出剩余的水印,达到版权声明的目的.方案的主要创新点如下.
(1) 提出了分级可逆的关系数据水印方案.通过将数据划分为若干个数据分区,实现以分区为单位的水印
嵌入,各数据分区中的水印均可声明版权.
(2) 定义数据质量等级来反映数据的可用性,通过对数据分区中的水印执行逆操作,实现数据质量等级的
提升,灵活调节数据可用性.
1 相关工作
关系数据数字水印技术由 Agrawal 等人首次提出,其基本原理是在某些特定的元组、特定的属性值以及特
[7]
定的比特位包含特殊值,这些特殊值的组合构成数字水印 .特定位置和特殊值的选择,由密钥决定.水印检测时
只需提供密钥,不需要原始数据.Sion 等人将关系数据分割为大小相同的分区,而水印的嵌入则是通过改变分区
[9]
的分布特性实现的 [8,9] .但是该方案采用的数据分区方法难以抵御元组删除攻击和元组添加攻击 .牛夏牧等人
提出一种可将具有实际意义的字符串嵌入到关系数据中的水印方案 [10] ,其本质是在关系数据的属性编号和最