Page 147 - 《软件学报》2021年第12期
P. 147
张健 等:基于实值 RBM 的深度生成网络研究 3811
化数据分布和模型分布之间的 JS 散度.第 4 张图像是由 WGAN-GP [18] 生成的,WGAN-GP 将 JS 散度替换为
Wasserstein 距离并优化求解方式,从而解决了 JS 散度中距离度量问题,是目前非常常用的图像生成算法.第 5 张
图像是由 ACGAN 生成,可以看出,ACGAN 生成的图像在细节上更接近原始图像.
接下来,本文测试了所提出的模型在 small Norb 数据集上的图像重构能力和图像生成能力.实验中,
ACGAN 中的生成器有 2 个全连接层和 2 个反卷积层,判别器有 2 个卷积层和 2 个全连接层.生成器和判别器均
采用 leakyReLU 激活函数以及 Batch-Norm.DCGAN,LSGAN 和 WGAN-GP 具有与 ACGAN 相同的网络结构.
生成器和判别器的初始学习率为 8e−5.图 10 展示了模型在 small Norb 上的重构图像.
Fig.10 Reconstructed images and generated images on small Norb
图 10 small Norb 上的重构图像和生成图像
在图 10 中,左数第 1 张图像由 RTGMM 重构得到.RTGMM 可以看作是一种实值单元的 RBM 模型,能够很
好地结合到神经网络中.第 2 张图像由 ARBM 重构得到,第 3 张图像由 ADBN 重构得到.可以看出:相比于传统
的 RBM 方法,ARBM 和 ADBN 在 small Norb 数据集上重构的图像更清晰.第 4 张图像是由 DCGAN 生成的,第
5 张图像是由 WGAN-GP 生成的,最后一张图像由 ACGAN 生成.可以看出,ACGAN 生成的图像相对于其他常用
的以 GAN 为基础的生成模型更为清晰、更接近于原始的图像.接下来,我们测试了模型在 Fashion 数据集上的
图像重构和图像生成能力,得到的图像如图 11 所示.
Fig.11 Reconstructed images and generated images on Fashion
图 11 Fashion 上的重构图像和生成图像
在图 11 中,第 1 张图像是由 ADBN 重构得到的.第 2 张图像由 DCGAN 生成.第 3 张图像由 LSGAN 生成,
LSGAN 是一种深度对抗生成网络,其中,目标函数被替换为均方误差的形式.第 4 张图像由 WGAN-GP 生成.最
后一张图像由 ACGAN 生成.可以看出,ACGN 生成的 Fashion 图像更清晰、更接近原始图像.
Cifar-10 对于 32×32 分辨率的图像生成任务而言是困难的,因为 Cifar-10 是彩色的,其背景也更复杂.特别是
对于没有卷积结构的浅层网络(如 ARBM),很难生成 Cifar-10 数据.本节尝试使用两个隐藏层的 ADBN 来学习
Cifar-10 数据集.在 ADBN 中,第 1 隐藏层有 5 000 个单元,第 2 隐藏层有 1 500 个单元.ADBN 重构的图像和生
成的图像如图 12 所示.
如图 12 所示:尽管 ADBN 提取输入图像能够可视化边缘特征,但生成的图像过于平滑和模糊.我们认为,导
致图像模糊的主要原因是卷积运算难以加入 RBM 模型.因为在 RBM 训练过程中,卷积和池化运算是不可逆的.
为了建立一个有效的基于 ADBN 的深度卷积生成神经网络,我们利用 ADBN 提取的深度特征作为 CGAN 的条
件输入数据提出 ACGAN 模型,我们将 ACGAN 生成的图像与现有模型(例如 DCGAN,WGAN-GP 和 Real-NVP
模型)生成的图像进行比较 [19] .Real-NVP 模型是一个非对抗性可逆生成神经网络.在本实验中,为了生成彩色图