Page 203 - 《软件学报》2020年第10期
P. 203
陈德彦 等:基于领域语义知识库的疾病辅助诊断方法 3179
感,很难在短期内提供对大量常见疾病的辅助诊断支持.而采用本文的方法则可以避开这些问题,快速支撑对大
量常见疾病的辅助诊断.
当然,本文的方法也存在一些不足.一方面,领域语义知识库的建立和维护是一项知识密集型的工作,需要
领域专家的参与;另一方面,在训练样本足够大时,本文的方法在准确性上不及朴素贝叶斯分类和决策树分类的
方法.
5 相关工作
疾病诊断的质量主要依赖于医疗专家所掌握的医疗知识以及医疗经验,早期的专家系统(expert system,简
称 ES) [59] 试图通过对人类专家的问题求解能力的建模,采用 AI 中的知识表示和知识推理技术来模拟通常由专
家才能解决的复杂问题,从而达到或超过专家解决问题的能力水平.ES 中的知识通常为采用规则描述的专家拥
有的启发式经验知识,并采用基于规则推理(rule-based reasoning,简称 RBR)的方法提供领域问题求解服务.从专
家那里获取知识的过程是一个时间密集型的过程,知识获取困难,而且依赖专家的意见,专家的意见有时具有主
观性.文献[60,61]结合本体知识库和语义 Web 规则实现了一个高血压疾病的诊断模型,基于 RBR 提供高血压疾
病的诊断推理.
在健康医疗领域,专家的经验知识往往蕴含于其诊治过的患者的病历数据中,如果能够直接利用蕴含于这
些病历数据中的专家的经验知识,则将避开从专家那里直接获取经验知识的瓶颈,因为知识获取只不过是获得
过去发生过的案例(case).基于案例的推理(case-based reasoning,简称 CBR) [62] 分类法的研究即借鉴了这样的思
想.CBR 的底层思想是基于这样一个假定:相似问题具有相似的解.例如,在医疗健康领域,通过收集和存储医疗
专家诊治过的患者的病历和治疗方案,作为源案例库,并基于源案例库求解目标案例,即用来帮助诊断和治疗新
的患者.由于传统 AI 技术存在的知识获取、记忆、维护等方面的问题,文献[63]讨论了实现智能医疗诊断系统
的 CBR 方法学、研究问题和技术方面.Ain Shams 大学的医疗信息研究组(medical informatics research group)
基于 CBR 技术开发了一个用于癌症和心脏病诊断的系统,文献[63]也对此进行了讨论.文献[64]讨论了 CBR 在
医疗领域的适宜性,指出了存在的问题、局限性和部分克服这些问题、局限性的可能性.在健康医疗领域,专家
的知识包括理论知识和经验知识,针对典型、复杂的诊疗案例,专家会基于理论知识,经验知识,特定的空间、时
间和患者个体情况做出综合的诊疗建议推理.历史诊疗案例虽然可能蕴含了一部分专家的理论知识和经验知
识,但仍然脱离了大量专家知识的支撑,所以新旧案例适配(adaptation)的合理性是 CBR 面临的主要问题.
健康医疗大数据的出现也为利用数据挖掘和机器学习技术直接从大量的历史病历数据中获取知识提供了
可能性.文献[2]基于决策树和朴素贝叶斯算法提出了一种用于心脏疾病诊断的新方法,可以减少诊断需要输入
的属性数量,从而减少诊断过程中需要对患者进行的实验数量,以提升诊断的效率.文献[3]使用减法聚类算法
(subtractive clustering algorithm)开发了一个模糊推理系统(fuzzy inference system),并运用该系统对患者的 MRI
影像进行分类,以识别轻度认知障碍(mild cognitive impairment)、阿尔茨海默病(Alzheimer’s disease)和正常对照
组(normal control).文献[4]使用 BP(backpropagation)学习算法训练了一个多层感知机(multi layer perceptron),用
于诊断和预测新生儿疾病(neonatal diseases).文献[5]对有监督机器学习算法在临床上用于辅助诊断帕金森病
(Parkinson’s disease)和进行性核上性麻痹(progressive supranuclear palsy)的可行性进行了评估.这些研究探讨了
数据挖掘和机器学习算法在某些单病种疾病辅助诊断和预测方面的应用效果.利用数据挖掘和机器学习技术
构建的疾病诊断模型,可以提供比人工手段更高的疾病识别率和检出效率.但针对不同病种,需要分别构建单独
的疾病诊断模型,所以短时间内还无法提供对大量常见疾病的辅助诊断服务.
在健康医疗领域,已经积累了大量结构化的知识.例如,基于本体模型构建的领域语义知识库.基于领域语
义知识库的方法可以快速提供大量常见疾病的诊断服务.文献[12]探讨了一些用于癌症疾病的基于本体的医疗
系统的技术问题,也提出了一种基于本体的用于癌症疾病辅助诊断的方法学.该方法学能够被应用于帮助患
者、学生和医生判断癌症的类型、癌症所处的分期以及如何治疗.文献[13]提出了一种新的遗传疾病鉴别诊断
的数学模型,而不是传统的基因突变分析方法.它通过本体描述了“基因型-表型”关联关系.患者新出现的基因突