Page 146 - 《软件学报》2021年第12期
P. 146
3810 Journal of Software 软件学报 Vol.32, No.12, December 2021
Norb,Fashion 和 Cifar-10.数据集的属性见表 1.
Table 1 Attributes of data sets
表 1 数据集的属性
数据集 训练样本 测试样本 属性 标签
MNIST 50 000 10 000 28×28 10
small Norb 24 300 24 300 32×32 5
Fashion 50 000 10 000 28×28 10
Cifar-10 50 000 10 000 32×32 10
MNIST 数据集是由 250 名来自不同人群的实验人员完成的手写数字数据集,其中包括 MNIST 基本数据
集、MNIST back-rand 数据集和 MNIST back image 数据集等.Norb 是一个由灰度化的双视角玩具图像组成的
数据集,包含 5 类玩具(人、动物、汽车、飞机、卡车),在不同的光照条件下,由相机系统从不同的角度进行成像.
本节实验将两幅立体图像的原始分辨率从 108×108×2 降低到 32×32×2,以加快实验速度.Fashion 数据集包含了
10 个类别的图像,分别是 t-shirt,trouser,pullover,dress,coat,sandal,shirt,sneaker,bag,ankle boot.Cifar-10 是常用于目
标识别的计算机视觉数据集,它是 8 000 万个微型图像数据集的一个子集,由 60 000 个 32×32 分辨率的彩色图
像组成,包含 10 对象类,每个类有 6 000 个图像.
本实验在 MNIST,small Norb 和 Cifar-10 上测试了这些模型的图像重构能力,原始图像如图 8 所示.
Fig.8 Original images of MNIST, small Norb, and Cifar-10
图 8 MNIST,small Norb 和 Cifar-10 的原始图像
与 GAN 不同,ARBM 和 ADBN 的模式塌陷问题并不严重.然而,似然函数过平滑的问题阻碍了模型生成锐
利的图像.为了保持多模态特征并产生清晰的图像,本文将提取的 ADBN 特征作为 CGAN 的条件输入,测试了
ACGAN 的生成能力.第 1 个实验在 MNIST 数据集上测试了所提出的 ARBM,ADBN 的图像重构能力以及
ACGAN 的图像生成能力.所用的 ARBM 具有 1 000 个隐藏层单元,重构和生成的图像如图 9 所示.
Fig.9 Reconstructed images and generated images on MNIST
图 9 在 MNIST 上的重构图像和生成的图像
在图 9 中,左数第 1 张图像是由 ARBM 重构的图像,第 2 张图像是由 ADBN 重构的图像.如图 9 所示,本文
提出的 ARBM 算法能够提取手写体图像的边缘特征,得到平滑的图像.此外,ADBN 重构的图像相比于 ARBM
而言与原始图像更为相似.第 3 张图像是由深度卷积生成对抗网络(deep convolutional generative adversarial
network,简称 DCGAN)生成的 [17] ,DCGAN 是一种引入了深度卷积结构的深度对抗生成网络,其目标函数是最小