Page 211 - 《软件学报》2021年第5期
P. 211
宋杰 等:基于深度学习的数字病理图像分割综述与展望 1435
Fig.8 Structures of LSTM [62] and GRU [63] modules
图 8 LSTM 单元 [62] 和 GRU [63] 模块结构
3.5 生成对抗网络
在各种不同的深度网络模型中,GAN 是一种简单有效的数据建模工具,在其整个训练过程中,都无需提前
对数据做任何假设,因而受到了众多学者的青睐 [67] .此种网络结构通常包含两个部分,即生成器(generator)和判
别器(discriminator).如图 9 所示,判别器试图区分由生成器产生的伪数据和真实数据,而生成器则想要产生与真
实数据更加相似的伪数据去扰乱判别器,此过程类似于博弈论中的二人零和博弈(zero-sum game).GAN 的训练
实质是寻找零和博弈的一个纳什均衡解.最终,生成器能够产生与真实数据拥有相同分布的伪数据,也即学习到
了真实数据的潜在分布.
Fig.9 Network arhitecture of GAN
图 9 GAN 基本网络架构
近年来,基于 GAN 网络模型,很多改进的方法被提出来,广泛应用于图像到图像的转换(image-to-image
translation)中.例如:Radford 等人采用反卷积层代替生成器网络中的全连接层对图像进行生成 [68] ;Arjovsky 等人
将 Wasserstein 距离引入损失函数,由此估计真实样本分布和生成样本分布不重叠情况下的距离 [69] .此外,研究人
员发现:GAN 通过半监督方式添加图像类别标签进行训练,可极大提高生成样本的质量.基于此,Mirza 等人提出
了一个带条件约束的 GAN 模型,称为条件 GAN(conditional GAN,简称 CGAN) [70] .至于其他相关工作,请读者参
考 GAN 源码链接(https://github.com/hindupuravinash/the-gan-zoo).
3.6 硬件和软件
深度学习算法相关文献急剧增加的主要原因之一,来自于图形处理器(graphics processing unit,简称 GPU)
和 GPU 计算库的可用性.GPU 是高度并行的计算引擎.与传统中央处理器(central processing unit,简称 CPU)相
比,GPU 的运算速度要高出一个数量级甚至以上,使其对运行分析和深度学习算法尤其有用.
除了硬件,随着开源软件包在深度学习领域的普及应用,很多深度学习库被提出来,广泛应用于诸如卷积操
作等高效 GPU 实现中.深度学习库提供了一系列深度学习组件.用户通过直接调用函数接口定义新的算法,无
需从复杂的神经网络开始编写代码.代表性的深度学习库包括:
(1) Tensorflow [71] :该框架最初由谷歌大脑团队开发,用于 Google 的研究和生产,提供 C++接口和 Python
接口.