Page 207 - 《软件学报》2021年第5期
P. 207

宋杰  等:基于深度学习的数字病理图像分割综述与展望                                                      1431


                 浅,而边缘附近染质较深,而着色较深的核仁也大量出现在核内;另一方面,由于病理图像中往往细胞密度高、细
                 胞间出现重叠和成团等突出问题,加剧了个体细胞分割的难度.与颗粒状目标分割不同,神经纤维等管状结构的
                 完整形态追踪和重构是描述神经元类型的关键参数.然而,一方面,由于受成像和着色局限性的影响,使得管状
                 和树状纤维的灰度及厚度发生急剧变化,导致其形态不规则;另一方面,纤维扭曲、纤维间出现缠绕等问题,加剧
                 了个体纤维追踪的难度.高效的分割算法需要在提取图像语义特征的同时,建模实例的底层图像信息.一方面,
                 现有方法是问题导向的,使其可迁移性较差,导致分割性能受到限制;另一方面,由于神经纤维扭曲、缠绕,细胞高
                 密度分布、粘连重叠等,建模过程容易丢失底层图像信息,加剧了病理图像实例分割的难度.
                    此外,小样本问题是指数据规模大但其中标注样本很少.数字病理图像的人工标注往往需要专业人士的指
                 导,不仅耗时耗力,而且存在主观差异性.因此在实际操作中,由于受少量可训练样本的影响,使得具有强表达能
                 力的分割模型易产生过拟合结果.
                    表 1 列出了现有公开病理数据集.
                                  Table 1    Overview of histopathological image sets publicly available
                                           表 1   现有公开的组织病理图像数据集概述
                    数据及相关文献       图像尺寸(像素)      图像数     染色方法      疾病类型        额外数据            用途
                      TCGA [34]     400×400     18 462   H&E      肾细胞癌      基因组、转录组        细胞核检测
                                                                             和表观基因组          与分割
                             [6]
                     Warwick-QU     574~775×     165     H&E     结肠直肠癌       腺区域掩膜           腺分割
                                    430~522
                   CAMELYON17 [32]    131072~195072×   1 000   H&E   乳腺癌     癌症区域掩膜        乳腺癌转移
                                   80384~90112                  (淋巴结转移)                    检测与分类
                       KIMIA                             H&E,
                      Path960 [35]    308×168    960      IHC    各类型组织           −         上皮细胞分割
                        Bio-        896×768,     58      H&E                               细胞分割、
                    Segmentation [36]    768×512                   乳腺癌           −          微管追踪
                                   3752~8040×                                               神经元、
                     DIADEM [37]    2280~4343,   302(图像   −        各类型        中轴线和         投射纤维、
                                   1024×1024,   切片层数)              神经元        体素坐标        爬行纤维、轴突
                                    512×512                                                追踪与重构
                      Kather [38]    1000×1000   100      IHC    结肠直肠癌        血管计数          血管检测
                       MITOS-      1539×1376,                               有丝分裂坐标、       有丝分裂检测、
                     ATYPIA-14 [39]    1663×1485   4 240   H&E     乳腺癌      核异型评估准则       细胞核异型分类
                      Kumar [40,41]    1000×1000   44    H&E     各类型癌症      细胞核边缘坐标        细胞核分割
                                   2000×2000,                               有丝分裂坐标、       有丝分裂检测、
                                    100×100,                                淋巴细胞坐标、       淋巴细胞检测、
                        DEEP                                      乳腺癌、
                     LEARNING [42]    1000×1000,   681   H&E     结肠直肠癌      上皮细胞掩膜、       上皮细胞分割、
                                   2000×2000,                                细胞核掩膜、        细胞核分割、
                                    775×522                                  腺区域掩膜           腺分割
                      Gertych [43]    1200×1200   210    H&E      前列腺癌       腺区域掩膜           腺分割
                      MEGA [44]     1280×800     300     H&E       结肠癌      结肠癌区域掩膜        病理图像分割
                    AMIDA2016 [45]    2000×2000   621    H&E       乳腺癌       ROI 区域掩膜    病理 ROI 区域检测
                                    565×584,                       糖尿病
                       DRIVE,                   40,20,45        视网膜病变、      血管区域掩膜、       视网膜血管分割
                    STARE, HRF  [46]    700×605,          −                  视场角掩膜
                                    3504×2336                   脉络膜病变等
                    因此,病理图像分割具有如下新挑战.
                    (1)  由于组织病理图像中组织基元高密度分布、基元间出现重叠、缠绕,使得传统基于图像分析方法的
                         检测与分割很难获得正确的结果.
                    (2)  对于病理状态图像而言,由于染质稀疏、背景杂斑干扰、表观多样等,基于有效特征提取的个体基元
                         精准实例分割是一个挑战性问题.
                    (3)  对于不同类型的病理图像而言,由于图像特性存在显著差异,如何设计一个普适的分割方法是一个重
                         要且具有挑战性的研究问题.
   202   203   204   205   206   207   208   209   210   211   212