Page 204 - 《软件学报》2020年第10期
P. 204

3180                                  Journal of Software  软件学报 Vol.31, No.10, October 2020

         变被映射到人类表型本体(human phenotype ontology)中的标准化词汇表上.然后用这些术语进行鉴别诊断.将
         信息理论与模糊关系理论相结合,通过度量基于本体的语义相似度来实现鉴别诊断.该系统能够诊断 5 种复杂
         疾病的发生概率,即淋巴水肿产生综合症(lymphedema-distichiasis syndrome)、狄兰吉氏症候群(Cornelia de
         Lange syndrome)、科恩综合症(Cohen syndrome)和 Smith-Lemli-Opitz 症候群.文献[14]基于同现(co-occurrence)
         和信息内容,提出了度量本体中术语间相似性以及使用本体中的术语标注实体间的语义相似性的方法.新的相
         似性度量方法被证明比现有的使用生物学途径(biological pathway)的方法更好.该相似性度量方法使用与疾病
         相关的生物过程(biological processe)来评估疾病间的相似性,并使用已知疾病相似性的人工策划的数据集对该
         方法进行了评价.此外,使用本体来对疾病、药物和生物过程进行编码,并演示了一种方法,该方法使用基于网络
         的算法将有关疾病的生物学数据与药物信息结合起来,从而为现有药物找到新的用途.通过与现有的药物相关
         临床实验进行对比,验证了该方法的有效性.文献[1]的研究工作是欧洲项目 K4CARE                          [65] 的一部分,该项目的目
         标是将医疗保健和一些西方和东欧国家的信息和通信技术(ICT)经验结合起来,以建立、实施和验证一个基于
         知识的医疗保健模式,以向居家老年患者提供专业援助.该项目聚焦于 9 种慢性疾病、2 种综合征和 5 个社会问
         题,使用 CPO(case profile ontology)本体描述了与它们相关的知识,并使用 SDA(state-decision-action)图描述了相
         关的干预计划.文献[1]展示了该项目中开发的用于疾病诊断和本体个性化的方法和工具,其疾病诊断方法存在
         一些明显的问题和不足,在本文的介绍部分已给出了详细说明.
             表 3 对已有的疾病辅助诊断方法的研究进行了总结,分析了各自的优势和劣势.这些方法除了在技术原理
         上不同以外,它们利用的数据也不一样.比如,文献[1]和文献[12]的方法利用了患者的症状和体征数据,文献[13]
         的方法利用了患者的基因数据,文献[3]的方法利用了患者的 MRI 影像数据等.有的数据(例如,症状和体征)比较
         好获取,而有的数据(例如,基因数据)的获取就比较困难.
             为了面向基层全科医生提供大量常见疾病的辅助诊断服务以及面向患者提供疾病自诊服务,本文的研究
         采用基于领域语义知识库的疾病辅助诊断方法.针对现有研究的不足,本文进行了校正和完善.

                            Table 3    Comparison of the aided diagnosis methods for diseases
                                         表 3   疾病辅助诊断方法比较
              方法                  描述                       优势                     劣势
                       基于规则描述疾病诊疗的知识或者专家                                规则知识获取和维护困难;当规则比
           基于 RBR 的   拥有的启发式经验知识,并基于 RBR 提供           准确性高、效率高         较少时,将无法提供问题解;当规则数
            方法 [60,61]
                             领域问题的求解服务                                    量比较大时,规则推理效率低
                                                    不需要明确的领域模型,避
                      基于“相似问题具有相似解”的思想,直接           开了知识获取的瓶颈;可以        由于案例涉及患者隐私,案例获取困
                       存储专家诊治过的历史病历作为源案例                               难;案例脱离了部分理论知识和经验知
           基于 CBR 的   库,并基于目标案例和源案例的相似性比            很快地产生问题的解;问题       识的支撑,案例适配的合理性是一个主
            方法 [63,64]                              解容易理解,具有直接的案
                      较,为目标案例直接提供问题解或者修正            例证据;即使具有少量的案         要的问题;CBR 推理过程不具有
                                 后的解                                             重用性等
                                                      例,CBR 也可以运行
                       利用数据挖掘和机器学习技术从健康医                                针对不同病种,需要分别构建单独的
           基于统计分析     疗大数据中获取疾病诊疗的模型知识,并            可以提供比人工手段更高         疾病诊断模型,短时间内无法提供对
            的方法 [2−5]                               的疾病识别率和检出效率
                              提供疾病诊疗服务                                   大量常见疾病的辅助诊断服务
           基于领域语义      采用结构化的领域语义知识库直接建立            可以快速提供对大量常见         准确性不高;知识构建和维护是一项
            知识库的       用于疾病诊疗的相关知识,并基于知识
            方法 [1,12−14]    查询和知识推理提供疾病诊疗服务          疾病的辅助诊断服务             知识和时间密集型的工作
         6    总结和进一步的工作

             本文从 Freebase RDF dump 包中抽取了 medicine 主题域的知识,并基于本体构建了 medicine 领域的语义知
         识库,由医学专家对疾病、症状及其语义关系进行了校验和完善.在此基础上,提出了基于领域语义知识库的疾
         病辅助诊断方法,包括计算知识库中症状于疾病诊断的权重、计算与患者输入症状集相关的疾病列表及其相关
         度排名、推荐与患者输入症状集中症状最相关的症状集供医生或患者进一步确认.整个疾病辅助诊断过程是在
         医生和患者参与下的一个循环迭代的过程,包括前瞻性诊断和回顾性诊断.最后基于医学专家筛选的真实病历
   199   200   201   202   203   204   205   206   207   208   209