Page 145 - 《软件学报》2021年第12期
P. 145

张健  等:基于实值 RBM 的深度生成网络研究                                                         3809


             图 6 是 ACGAN 的模型结构图,模型的训练分为两部分:首先,根据输入图像训练一个 ADBN 模型,在训练好
         的 ADBN 模型基础上,将输入图像传递给 ADBN 得到特征;该特征用作 CGAN 的附加输入 y 传递到 CGAN 的
         生成器和判别器,同时,图像输入也用作 CGAN 判别器中的真实样本.模型的目标函数可以表示为
                     min max ( , )V D G =  E xp  [log ( |D x ADBN ( ))x +  E z ~ z p  [log(1 D−  ( ( |G z ADBN ( ))))]]x  (17)
                      G  D           ~ data
         其中,x 来自于数据集.ADBN(x)是由 ADBN 得到的特征,该特征作为 CGAN 的附加输入.接下来,本文通过实验验
         证 ARBM,ADBN 和 ACGAN 的有效性.

         3    实验分析

             在实验中,我们尝试验证基于 ARBM 的模型在图像生成和图像重构任务中的有效性.实验主要分为两部分:
         一部分是图像重构,另一部分是图像生成.为了验证 ARBM 能够学习数据分布的流形结构,我们首先在 3 个人工
         数据集上进行对比实验,其中使用的基于 RBM 的模型具有完全相同的网络结构.结果如图 7 所示.




























                         Fig.7    Comparison of ARBM with other models on three artificial datasets
                                 图 7  3 个人工数据集上 ARBM 与其他模型的比较
             图 7 由 4 列样本组成,其中,
             •   第 1 列样本是原始数据;
             •   第 2 列样本是由 Gaussian-binary RBM 重构得到的,Gaussian-binary RBM 是一种可见层单元为实值、
                隐藏层单元为二值的 RBM 模型;
             •   第 3 列样本由受限截断高斯图模型(RTGMM)重构得到.RTGMM 是在 2017 年提出的一种无向概率图,
                其可见层单元和隐藏层单元都是实值的.不同于 ARBM,RTGMM 由一个可见层和一个隐藏层组成,其
                可见层单元和隐藏层单元是直接连接的;
             •   最后一列样本由 ARBM 重构得到.
             如图 7 所示,标准的 Gaussian-binary RBM 更倾向于把模型密度散布在其支撑数据集上.而不同于 Gaussian-
         binary RBM,ARBM 能够学习这 3 个数据集的分布特征,并识别出数据分布上的流形结构.
             接下来 ,本实验在真实数据集上测试 ARBM 和 ADBN 的图像重构能力 .数据集有 MNIST,small
   140   141   142   143   144   145   146   147   148   149   150