Page 193 - 《软件学报》2020年第10期
P. 193

陈德彦  等:基于领域语义知识库的疾病辅助诊断方法                                                        3169


         在个体差异,相同疾病于不同的患者可能表现出不同的症状,但通常某种疾病于大多数人会表现出一些相同的
         典型症状,比如感冒的典型症状有咳嗽、流鼻涕、流眼泪、发烧、食欲不振等,糖尿病的典型症状有“三多一少(多
         饮、多食、多尿、体重减轻)”等.所以,虽然不同的疾病可能表现出一些相同的症状,但这些疾病表现出的典型
         症状不一定相同.或者说,相同症状于不同疾病的判断权重可能是不一样的.
             针对以上问题,基于症状来诊断疾病的关键点是给出每一个症状于疾病诊断的重要性.对此,文献[1]进行了
         研究,提出这个重要性将基于症状被包含的疾病数量来给出.比如,肌无力(muscle weakness)是一个在许多疾病
         中都出现的症状,因此它于疾病诊断的贡献很小;而另一个症状,心动过缓(bradycardia)是另一小簇疾病特有的
         症状,如果患者提供的症状中包含了这个症状,那么该患者患有的疾病很有可能落在这一小簇疾病中.基于此推
         理,文献[1]提出了用于计算本体知识库中症状 s 的权重(weight)w s 的算法,并基于 w s 提出了计算与患者输入症状
         集 S 相关的疾病 d i 的相关度(relevancy)w i 的算法,然后基于 w i 对筛查出的相关疾病进行排序.但文献[1]中计算
         w i 的算法存在以下 3 点明显问题.
             (1)  w i 的取值大于 1,且最小值为 1.当疾病 d i 关联了患者输入症状集 S 中的所有症状时,w i 的取值为 1;否
         则,w i 的值大于 1.由于疾病 d i 与患者输入症状集 S 的相关度是一个概率,从概率的含义上讲,w i 的取值不可能大
         于 1;如果 w i 的取值为 1,表示必然事件,即疾病 d i 一定与该患者相关.所以,文献[1]中计算 w i 的算法存在明显的
         错误.
             (2)  根据计算 w i 的算法,当疾病 d i 关联的患者输入症状集 S 中的症状的 ∑            w 越小时,w i 的取值反而越大,这
                                                                        s
         明显与上面文献[1]中的症状重要性推理结论相悖.
             (3)  在计算 w i 的算法中,分子的取值始终为 ∑        s S∈  w s , 症状集 S 中与疾病 d i 没有关联的症状于疾病 d i 的相关
         度计算是没有作用的,而知识库中与疾病 d i 关联的所有症状对疾病 d i 的诊断都是有贡献作用的,这与静态知识
         库的假设基础有关,详见下面对文献[1]不足点的分析.
             除此以外,文献[1]中计算 w i 的算法还存在以下两点不足.
             (1)  未考虑知识库中与疾病 d i 关联的其他症状(不在患者输入症状集 S 中的症状)的影响作用.本体知识库
         中的每种疾病都关联了一定数量的症状,这种静态关联的假设基础是,疾病关联的所有症状共同作用于该种疾
         病.也即,如果一位患者表现出的症状集 S 完全覆盖了某种疾病关联的所有症状,没有多余症状,也没有缺失的症
         状,那么可以认为患者就是得了这种疾病.在这个假设条件下,如果两种疾病都包含了患者输入的所有症状或相
         同症状,并不能认为这两种疾病与患者的相关度是相同的,还需要考虑这两种疾病关联的其他症状的影响作用.
             (2)  未对筛查出疾病集中的疾病进行回顾性验证,即未根据筛查出的疾病集合评估和推荐与患者输入症状
         集 S 中的症状最相关的其他症状,供医生或患者确认;进而基于初始收集到的患者症状集 S 和患者再次确认的
         症状结果对疾病筛查结果集进行调整,并重新计算调整后的疾病集中的疾病的相关度.
             针对以上文献[1]中疾病辅助诊断算法存在的明显问题和不足,本文进行了改进和完善.本文的贡献如下.
             (1)  提出了一种基于领域语义知识库的疾病辅助诊断方法,包括前瞻性诊断和回顾性诊断.该方法分别给
         出了计算领域语义知识库中症状 s 的权重 w s 的算法、与收集到的患者症状集 S 中一个或者多个症状相关联的
         疾病 d i 的相关度 w i 的算法、与症状集 S 中的症状最相关的症状集 S rel 的算法.
             (2)  选取了 6 种常见疾病的临床病历数据对本文提出的方法进行了评价.对于每一份病历,从患者主诉和现
         病史中抽取症状信息作为患者输入的症状集.基于该症状集和本文提出的方法获得相关疾病列表及疾病相关
         度排名.从疾病相关度排名中,选取 Top-1(首诊断)和 Top-3(前 3 诊断)分别与病历数据中医生给出的诊断进行比
         较.同时,与文献[1]中的方法和基于统计的方法就诊断命中率进行了比较.
             本文第 1 节给出领域语义知识库的相关定义.第 2 节介绍本文的疾病辅助诊断方法所依赖的领域语义知识
         库的构建方法.第 3 节给出本文的疾病辅助诊断方法.第 4 节对本文提出的疾病辅助诊断方法进行评价.最后对
         本文进行总结,并指出下一步的研究工作.
   188   189   190   191   192   193   194   195   196   197   198