Page 296 - 《软件学报》2021年第10期
P. 296

3268                                 Journal of Software  软件学报 Vol.32, No.10, October 2021

                        大地缩短了系统时间.在本文实验中,当关键词总量n=1000时,方案所用时间花销是文献[8]中方案的1/30
                        左右.同时,本方案对关键词量 n 的剧烈增长有着较强的抵抗性,符合大数据环境下,关键词总量较大的
                        电子医疗系统的要求;
                    (3)  降低构建索引和陷门时间:构建索引和陷门时采用文档向量和矩阵乘法运算生成,矩阵过大直接导致计
                        算时间增多.本文将关键词向量通过分段构建成关键词矩阵,将关键词矩阵与设计的可逆矩阵做哈达码
                        积,使得构建索引和陷门所需时间大为降低.
                 1    相关工作

                             [9]
                    Song 等人 首次提出了可搜索加密的概念,采用将文档文件划分为若干词组,对词组进行加密.在搜索阶
                 段,服务器需要扫描整个密文词组进行匹配,但不能提供范围搜索.随后,Curtmola 等人                        [10] 构造了加密的哈希表
                 索引,表中包含关键词陷门和关键词的文档标识集合.文献[11,12]提出了关键词排序搜索方案,通过对相关度进
                 行保序加密,以实现对搜索结果的精确排序.
                    Li 等人 [13] 提出了关键词模糊匹配的搜索方案,一定程度上实现了模糊范围搜索.文献[4]基于 Simhash 的降
                 维思想,将文档关键词做 n-gram 处理并得到 Simhash 指纹来实现模糊搜索.但模糊搜索方案中只考虑到关键词
                 字符上的模糊处理,实际应用中存在大量同义词现象,不能输入关键词的所有同义词来查询所需文档,导致搜索
                 结果准确度较低.
                    为了实现精准的范围查询,Cao 等人          [14] 提出为每个文档创建文档向量,并利用向量空间模型和安全 KNN(K-
                 nearest neighbour)思想,实现多关键词的排序搜索.但是利用 KNN 实现范围查询需要很多次的重复迭代,导致效
                 率较低.文献[1517]引入了布隆过滤器以减少存储空间,但对模糊集合中每个关键词都需要用多个哈希函数来
                 将其插入到布隆过滤器中,因此会增加计算开销.文献[18,19]实现了基于对称的可搜索加密,不适用于医疗搜索
                 模型下的多用户环境.
                    文献[6]提出的基于公钥的可搜索加密方案和文献[20]中提出的基于属性的可搜索加密方案可以扩展实现
                 非对称密钥下的搜索加密,但该方案不能实现范围搜索.Xu 等人                    [21] 构造出第一个可以抵抗关键词猜测攻击并支
                 持模糊关键字搜索的加密方案.Ma 等人             [22] 为移动医疗系统设计了一种无证书的可搜索加密,以解决搜索加密
                 系统的证书托管问题.为了提高搜索陷门的隐私性,Wang 等人                   [23] 设计了支持多关键字的无需安全信道的可搜
                 索公钥加密.Chen 等人     [24] 提出了支持关键字搜索的双服务器加密方案.上述方案不支持范围搜索能力.文献
                 [2528]将关键词和文件映射到计算代价较高的合数阶群上并作双线性运算,搜索效率较低.文献[29]提出了一
                 种可以抵抗敏感信息泄露的加密,以解决解密密钥或陷门在可能被泄露情况下的安全性,但该方案不能提供搜
                 索功能  [30] .文献[31]提出一种医疗云中实现动态搜索能力的可搜索加密,但其基于对称的可搜索加密,实际应用
                 中对密钥管理带来一定的复杂性.文献[32]提出一种可验证的基于词典的可搜索加密方案,能够验证搜索结果
                 的完备性.文献[33]提出一种达到前向安全的轻量级的可搜索公钥加密方案,支持对工业物联网场景的安全数
                 据搜索应用.

                 2    预备知识

                 2.1   符号说明
                    本文中,n 表示医疗数据文件中的关键词数,m 表示多关键词搜索索引数(m≤n).文中将使用小写符号 a、b
                 等表示标量,大写符号 I、Q 等表示向量,使用空心大写字符 A、B 表示矩阵.表 1 对本文中主要出现的符号进行
                 了描述.
   291   292   293   294   295   296   297   298   299   300   301