Page 292 - 《软件学报》2021年第7期
P. 292

2210                                     Journal of Software  软件学报 Vol.32, No.7,  July 2021

                                                                     J
                                              ( )(log ( ) logp z 
                                                             ())dz 
                           D KL (( | ) || ( ))q z x  p z    qz  qz  1  (1 log(( ) ) (  2      j )   2  (  j ) 2 )  (8)
                               
                                                            
                                             
                                                                   2 j 1
                    然后从后验分布 qz                                                         (| )x 中生成新的 ˆ. x
                                   (| )x 进行采样得到新的隐含层编码 z,并将其输入至生成网络 qz
                                  
                    对于生成模型,可以使用伯努利分布去拟合原始的二值型数值,或者采用高斯分布拟合连续性的数值,在本
                 节中,我们依旧采用神经网络去拟合该生成模型,并使用最小均方误差作为重构的损失,该部分的整体框架如 5
                 所示.













                                 Fig.5    Heterogeneous feature mapping based on variational autoencoder
                                      (source project and target project jointly train the network)
                              图 5   基于变分自编码器的异构特征映射(源项目与目标项目共同训练网络)
                 3.2   基于最大均值差异的项目个性与共性特征学习

                    为了更好地捕获源项目与目标项目之间的公共语义特征信息,我们引入了最大均值差异(maximum mean
                 discrepancy)距离度量方式  [24] .边缘分布自适应方法最早由香港科技大学杨强教授团队提出                   [25] ,方法被命名为迁
                 移成分分析(transfer component analysis),它能够很好地计算两个分布之间的差异.通过对源项目和目标项目的
                                                                                      (| )x 的均值参数拥有
                 均值参数引入最大均值差异损失,可以有效地保证源项目与目标项目的后验概率分布 qz
                                                                                     
                 相似的分布,同时两者的差异通过方差参数体现.均值参数刻画了源项目与目标项目的共性特征,而方差特征凸
                 显了源项目和目标项目的个性特征.
                    在训练变分自编码器时,为了能让网络同时学习源项目与目标项目的分布信息,每次输入的批量样本一半
                 采样自源项目,一半采样自目标项目.为使两者在隐式空间享有相同的边缘概率分布,两者投影后的后验分布中
                                                                        s
                 均值向量的最大均值差异距离也被引入优化的目标.假设源项目为 X                         [, ,x x  1 s  2 s  , x s s n  ] R  dn  s  , 目标项目数据集
                    t
                 为 X  [, ,x x  1 t  2 t  , x t t n  ] R  d  t n  , 其中,n s 和 n t 分别表示源项目与目标项目的样本个数,同时源项目经推断网络映射
                                      2
                                                                   2
                                                                    ),
                                                                 ,
                                                                              ,
                                                                                ]
                                    ,
                                       ).
                 后的隐式特征 z    s  ~ N ( I 目标项目的隐式特征 z      t  ~ N ( I 且   [ 表示两者隐式特征分布的组
                                      s
                                                                 t
                                                                   t
                                                                             s
                                   s
                                                                               t
                 合,那么源项目均值参数和目标项目均值参数之间边缘分布的最大均值差异可由下式定义:
                                                      1  s n  1  t n  2
                                         MMD(   s ,  t  )     i s       i t  tr( M      T  )  (9)
                                                     n s  i  1  n t  i  1  2
                 其中,M 是最大均值差异系数矩阵,假设 M ij 表示 M 中的第 i 行、第 j 列元素值,那么 M ij 可以通过下式计算得出:
                                                     1                
                                                      2  ,         i ≤  n s , j ≤  n s 
                                                     n
                                                    ()                
                                                      s
                                                      1              
                                                                       
                                               M       ,         i   n  , j    n s              (10)
                                                 ij    2        s
                                                     n
                                                    ()                
                                                      t
                                                      1               
                                                        ,    otherw s ie  
                                                      n  n t         
                                                      s
   287   288   289   290   291   292   293   294   295   296   297