Page 447 - 《软件学报》2025年第7期

P. 447

3368 软件学报 2025 年第 36 卷第 7 期

  2 d
 ∑ 
   

Pr(Y ⩽ i) = 1− 1− p j   (8)
  
j∈[0,i]
此处, 由于 Y 是离散变量且为整数, 根据 Pr(Y ⩽ i) 的解析式, 可以求解 Pr(Y = i) 的解析式:

Pr(Y = i) = Pr(Y ⩽ i)−Pr(Y ⩽ i−1)
  2 d   2 d
 ∑   ∑ 
       

= 1− 1− p j −1+ 1− p j  



     
j∈[0,i] j∈[0,i−1]
  2 d   2 d
 ∑   ∑ 
       
= 1− p j − 1−   (9)




  p j
   
j∈[0,i−1] j∈[0,i]
根据期望的定义, 可得:

∑
E(Y) = i·Pr(Y = i)
i∈[0,n]
∑
= i·(Pr(Y ⩽ i)−Pr(Y ⩽ i−1))
i∈[0,n]
∑
= n·Pr(Y ⩽ n)− Pr(Y ⩽ i)
i∈[0,n−1]
     2 d
 ∑     ∑  
    
 2 d      
 



= n− 1−(1− p i )  +...+  − 1− p i 
 
  1 

      
i∈[0,0] i∈[0,n−1]
  2 d   2 d
 ∑   ∑ 
   
   


= 1− p i +...+ 1−   (10)


  p i
   
i∈[0,0] i∈[0,n−1]
d = 0, 哈希索引单元的空间为 0 比特.
这里先检查最简单的情况

  2 0   2 0
 ∑   ∑ 
       


E(Y) = 1− p i +...+ 1− p i  


     
i∈[0,0] i∈[0,n−1]
= n−(np 0 +(n−1)p 1 +...+ p n−1 )
( ( ) )
n
i
= n− n p (1− p) n−i
i
(( ) )
n
i
= n−n p (1− p) n−i
i
(( ) )
n−1
i
= n−n(1− p) p (1− p) (n−1)−i
i
= n−n(1− p)
= np (11)
下面检查 d = 1 的情况, 即哈希索引单元的空间为 1 比特时:

  2 1   2 1
 ∑   ∑ 
   
   


E(Y) = 1− p i +...+ 1−   (12)


  p i
   
i∈[0,0] i∈[0,n−1]
∑ ∑ ∑
这里需要简单分析 p j 函数的特性. 首先, p j 取值是 [0,1], 并且整体是递增的, 即 1− p j
j∈[0,i] j∈[0,i] j∈[0,i]
( ) 2 ( ) 2
∑ ∑ nc
整体是递减的. 此外, 1− p j =(1−p 0 )(1−p 0 ). 可得, 1− p i =(1− p 0 )(1− p 0 ) ≈ (1−p 0 )np=(1−p 0 ) .
j∈[0,0] i∈[0,0] 2 e
  2 1    
 ∑  ∑  ∑   ∑ 
     
  2 1    





E(Y) = 1− p i +...+(1− p i ) ⩽ 1− p i +...+ 1− p i (1− p 0 ) ⩽ np(1− p 0 ) (13)




  
     
i∈[0,0] i∈[0,n−1] i∈[0,0] i∈[0,n−1]
同理, 当哈希索引单元的空间增加到 d 个比特时, 可以得到 Y 的期望值如下:

442 443 444 445 446 447 448 449 450 451 452