Page 204 - 《软件学报》2021年第5期
P. 204
1428 Journal of Software 软件学报 Vol.32, No.5, May 2021
quantitative information of individual primitives. Machine learning algorithms, in particular deep models, are emerging as leading tools in
quantitative analyses of digital pathology. It has exhibited great power in feature learning with producing improved accuracy of various
tasks. This survey provides a comprehensive review of this fast-growing field. Popular deep models are briefly introduced, including
convolutional neural networks, fully convolutional networks, encoder-decoder architectures, recurrent neural networks, and generative
adversarial networks, and current deep learning achievements in various tasks are summarized, such as detection and segmentation. This
study also presents the mathematical theory, key steps, main advantages and disadvantages, and performance analysis of deep learning
algorithms, and interprets their formulations or modelings for specific tasks. In addition, the open challenges and potential trends of future
research are discussed in pathology image segmentation using deep learning.
Key words: digital pathology; histologic primitive; instance segmentation; feature representation learning; deep model
全视野数字切片是一种高分辨率的数字病理图像,其所包含的巨大信息为数字病理的定量分析提供了可
[1]
靠的基础 .病理量化分析对于乳腺癌、前列腺癌、肺癌等良恶性分级诊断具有重要意义,其中,组织基元形态
[5]
[4]
与目标测量是病理量化分析的重要依据.国际上,以 Lin Yang [2,3] 、Erik Meijering 、Badrinath Roysam 、Nasir
[7]
[6]
M. Rajpoot 、Bahram Parvin 为代表的众多学者对数字病理数据进行了大量的建模统计和量化分析,为当代数
[8]
[9]
字病理的发展奠定了重要的理论和实践基础.在国内,包括清华大学 、浙江大学 、复旦大学 [10] 、武汉大学 [11] 、
湖南大学 [12] 、四川大学华西医院 [13] 、南京信息工程大学 [14] 等在内的多家科研机构均在病理图像处理领域进行
了较深入的研究,极大地推动了数字病理在国内的发展和应用.
在病理诊断和分析过程中,显微解剖结构的分割起着关键作用.分割结果可被用于可视化组织基元形态、
计算与病变相关的定量化指标、定位感兴趣区域(region of interest,简称 ROI)以及辅助制定外科手术方案等.随
着数字病理的发展,临床和医学研究迫切需要能够进行多个器官和疾病状态的病理图像高精度分割方法.然而,
由于病理图像背景结构复杂,组织基元高密度分布、粘连重叠等,精准实例分割是一个挑战性问题(如图 1 所示).
Fig.1 Digital pathology images from different tissues and disease states
图 1 不同组织器官和疾病状态下的数字病理图像
目前,基于数据与模型驱动的深度学习分割方法是研究热点.传统人工特征选择依赖于大量专业知识,有限
[2]
的表达能力难以涵盖图像的全面信息 .深度学习可分层抽取原始图像的抽象特征,为解决表观多样性的图像
分割问题提供了有效途径.代表性网络包括卷积神经网络(convolutional neural network,简称 CNN) [15] 、全卷积
网络(fully convolutional networks,简称 FCN) [16] 、编码器-解码器 [17] 、循环神经网络(recurrent neural networks,
简称 RNN) [18] 以及生成对抗网络(generative adversarial network,简称 GAN) [19] .深度学习模型采用逐层训练方式,
完成从底层到高层的特征学习过程,利用深层特征表示学习来获取数据的高层语义信息,强调了模型对特征的
学习能力,甚至可通过微调对特征进行调整,以便得到更有效的特征表示.近年来,基于深度学习技术,大量方法
被提出来,广泛应用于目标检测 [20] 、图像分割 [21] 、自然语言处理(natural language processing,简称 NLP) [22] 、医
学成像 [23,24] 、计算生物学 [25] 等领域.通过自动发现潜在数据结构,深度学习在处理不同领域的不同数据时,也能
达到极佳的性能 [26−28] .
数字病理图像量化分析领域积累了数以千计的原始文献资料,以若干综述加以贯穿.例如:Gurcan 等人 [29]
概述了计算机辅助诊断的病理图像分析方法,包括预处理、细胞核与腺体分割、特征提取和分类;Veta 等人 [30]
专题论述了乳腺癌组织病理图像分析方法,并对有丝分裂检测和增殖评估进行了额外讨论;Irshad 等人 [31] 针对
特定染色的组织病理图像,总结了细胞核检测、分割、特征提取以及分类方法.最近,来茂德等人 [10] 结合数字病
理图像,对细胞、腺体等组织基元的检测与分割算法进行了补充.