Page 207 - 《软件学报》2021年第5期
P. 207
宋杰 等:基于深度学习的数字病理图像分割综述与展望 1431
浅,而边缘附近染质较深,而着色较深的核仁也大量出现在核内;另一方面,由于病理图像中往往细胞密度高、细
胞间出现重叠和成团等突出问题,加剧了个体细胞分割的难度.与颗粒状目标分割不同,神经纤维等管状结构的
完整形态追踪和重构是描述神经元类型的关键参数.然而,一方面,由于受成像和着色局限性的影响,使得管状
和树状纤维的灰度及厚度发生急剧变化,导致其形态不规则;另一方面,纤维扭曲、纤维间出现缠绕等问题,加剧
了个体纤维追踪的难度.高效的分割算法需要在提取图像语义特征的同时,建模实例的底层图像信息.一方面,
现有方法是问题导向的,使其可迁移性较差,导致分割性能受到限制;另一方面,由于神经纤维扭曲、缠绕,细胞高
密度分布、粘连重叠等,建模过程容易丢失底层图像信息,加剧了病理图像实例分割的难度.
此外,小样本问题是指数据规模大但其中标注样本很少.数字病理图像的人工标注往往需要专业人士的指
导,不仅耗时耗力,而且存在主观差异性.因此在实际操作中,由于受少量可训练样本的影响,使得具有强表达能
力的分割模型易产生过拟合结果.
表 1 列出了现有公开病理数据集.
Table 1 Overview of histopathological image sets publicly available
表 1 现有公开的组织病理图像数据集概述
数据及相关文献 图像尺寸(像素) 图像数 染色方法 疾病类型 额外数据 用途
TCGA [34] 400×400 18 462 H&E 肾细胞癌 基因组、转录组 细胞核检测
和表观基因组 与分割
[6]
Warwick-QU 574~775× 165 H&E 结肠直肠癌 腺区域掩膜 腺分割
430~522
CAMELYON17 [32] 131072~195072× 1 000 H&E 乳腺癌 癌症区域掩膜 乳腺癌转移
80384~90112 (淋巴结转移) 检测与分类
KIMIA H&E,
Path960 [35] 308×168 960 IHC 各类型组织 − 上皮细胞分割
Bio- 896×768, 58 H&E 细胞分割、
Segmentation [36] 768×512 乳腺癌 − 微管追踪
3752~8040× 神经元、
DIADEM [37] 2280~4343, 302(图像 − 各类型 中轴线和 投射纤维、
1024×1024, 切片层数) 神经元 体素坐标 爬行纤维、轴突
512×512 追踪与重构
Kather [38] 1000×1000 100 IHC 结肠直肠癌 血管计数 血管检测
MITOS- 1539×1376, 有丝分裂坐标、 有丝分裂检测、
ATYPIA-14 [39] 1663×1485 4 240 H&E 乳腺癌 核异型评估准则 细胞核异型分类
Kumar [40,41] 1000×1000 44 H&E 各类型癌症 细胞核边缘坐标 细胞核分割
2000×2000, 有丝分裂坐标、 有丝分裂检测、
100×100, 淋巴细胞坐标、 淋巴细胞检测、
DEEP 乳腺癌、
LEARNING [42] 1000×1000, 681 H&E 结肠直肠癌 上皮细胞掩膜、 上皮细胞分割、
2000×2000, 细胞核掩膜、 细胞核分割、
775×522 腺区域掩膜 腺分割
Gertych [43] 1200×1200 210 H&E 前列腺癌 腺区域掩膜 腺分割
MEGA [44] 1280×800 300 H&E 结肠癌 结肠癌区域掩膜 病理图像分割
AMIDA2016 [45] 2000×2000 621 H&E 乳腺癌 ROI 区域掩膜 病理 ROI 区域检测
565×584, 糖尿病
DRIVE, 40,20,45 视网膜病变、 血管区域掩膜、 视网膜血管分割
STARE, HRF [46] 700×605, − 视场角掩膜
3504×2336 脉络膜病变等
因此,病理图像分割具有如下新挑战.
(1) 由于组织病理图像中组织基元高密度分布、基元间出现重叠、缠绕,使得传统基于图像分析方法的
检测与分割很难获得正确的结果.
(2) 对于病理状态图像而言,由于染质稀疏、背景杂斑干扰、表观多样等,基于有效特征提取的个体基元
精准实例分割是一个挑战性问题.
(3) 对于不同类型的病理图像而言,由于图像特性存在显著差异,如何设计一个普适的分割方法是一个重
要且具有挑战性的研究问题.