Page 411 - 《软件学报》2025年第5期
P. 411

王笑 等: 面向属性网络社团检测的度修正广义随机块模型                                                     2311



                    考虑所有社团, 节点对       (i, j) 生成连边的可能性为:

                                                          c ∑
                                                      ˆ A i j =                                       (2)
                                                            d i b ir h rs d j b js
                                                         r,s=1
                    给定模型参数      B,H  和观测变量节点的度      D = (d i ) 1×n  后, 生成网络   G 的概率  P(A|B,H,D) 为:

                                                               n ∏
                                                    P(A|B,H,D) =  ( ˆ A ij ) a ij                     (3)
                                                              i,j=1
                                                  ∑ c                                 ∑ n      ∑ n
                                                                                                   ˜
                 其中, 概率矩阵   H 是对称的且满足约束条件              h rs = 1 , 节点隶属度矩阵   B 满足约束条件      d i b ir =  b ir = 1 .
                                                    r,s=1                               i=1      i=1
                                                                                              H  对角线元素
                 由于概率矩阵     H = (h rs ) c×c  的引入, 继承了随机块模型的优点, 可以检测多种网络结构, 比如概率矩阵
                 大于非对角线元素时, 可以检测传统的社团结构; 对角线元素小于非对角线元素时, 可以检测网络的异配结构; 其
                 他情况可以检测更多的网络结构.

                 2.2   基于属性信息的生成模型
                    在属性网络中, 节点属性通常用高维向量表示. 如果一组高维向量中具有相同分量的个数越多, 其对应节点构
                 成的网络拓扑结构一致的可能性越大, 越容易形成社团结构. 假设网络中节点属性的生成也服从幂函数形式的分
                                     k
                 布,   θ rk  为社团  V r  具有属性   的概率,   Θ = (θ rk ) c×K  是社团相关属性矩阵. 一般地, 对于不同类型的网络, 节点度与节
                                                                                          V r  中节点   具有属
                                                                                                  i
                 点属性的关系可能呈现多样性. 但在一些网络中, 节点度与节点属性具有相关性. 基于此, 社团
                                                                             i
                 性  k 与节点隶属度   b ir  、节点的度  d i  以及社团相关属性  θ rk  有关, 社团   V r  中节点   具有属性  k 的可能性为:

                                                         r
                                                        ˆ X = d i b ir θ rk                           (4)
                                                         ik
                    考虑所有社团, 节点      i 具有属性  k 的可能性为:

                                                            c ∑
                                                       ˆ X ik =                                       (5)
                                                             d i b ir θ rk
                                                           r=1
                      ∑ n      ∑ n      ∑  K
                 其中,      d i b ir =  ˜ b ir = 1,  θ rk = 1  满足归一化约束条件.
                        i=1      i=1      k=1
                    给定模型参数      B,Θ 以及观测变量节点的度       D 后, 网络中生成节点属性的概率          P(X|B,Θ,D) 为:

                                                                 K
                                                              n ∏ ∏
                                                  P(X|B,Θ,D) =    ( ˆ X ik ) x ik                     (6)
                                                             i=1  k=1

                 2.3   融合拓扑信息和属性信息的度修正广义随机块模型
                    假设网络拓扑信息和节点属性的生成过程相互独立, 则度修正的属性网络广义随机块模型                               DCGSB  的联合概
                 率为:

                                    P(A,X|B,H,Θ,D) = P(A|B,H,D)× P(X|B,Θ,D)
                                                                 a i j          x ik
                                                       n                 K  c
                                                    n ∏∑            n ∏ ∏ ∑
                                                                                
                                                                 
                                                  =       d i b ir h rs d j b js ×     d i b ir θ rk    (7)
                                                                 
                                                                 
                                                                               
                                                                
                                                   i,j=1 r,s=1       i=1  k=1  r=1
                    如图  1  所示, 与  GSB  模型相比, DCGSB  模型进一步假设一条边的生成概率还依赖于其两端节点的度, 并且针
                 对无向属性网络, 在对网络拓扑信息建模的同时对节点属性进行建模, 其节点属性的生成也服从幂函数形式的分
                 布. 图  1  中阴影圆表示观测变量, 图      1(a) 中的无阴影圆表示隐变量, 虚线表示两个变量之间的关系, 实线表示观测
                 到的连边; 图   1(b) 中的无阴影圆表示模型参数. DCGSB         算法的建模过程如图        1(b) 所示. 根据建模过程, 网络中节
                 点间连边的生成和节点属性的生成步骤可以总结如下.
                                                               j
                    (1) 从社团  V r  和   V s  中分别以概率  b ir  和  b js  抽取节点  i 和   .
                                                            ∑
                                                               c
                                j
                    (2) 在节点  i 和   之间以概率   ˆ A ij  生成连边, 其中   ˆ A i j =  d i b ir h rs d j b js  .
                                                               r,s=1
                    (3) 从社团  V r  中以概率   θ rk  选择一种属性  k .
                                                         ∑  c
                    (4) 给节点  i 以概率   ˆ X ik  选择一种属性, 其中   ˆ X ik =  d i b ir θ rk  .
                                                            r=1
   406   407   408   409   410   411   412   413   414   415   416