Page 236 - 《软件学报》2020年第9期
P. 236
陈德彦 等:专家视图与本体视图的语义映射方法 2857
性的判断,不但要表达患者与疾病的关系,还要描述这种关系的可能性大小或者风险等级.这些结构
化值和不确定关系的描述都涉及到多元(n-ary)关系,而本体只能描述二元(binary)关系;
3) 访问授权的语义映射.领域本体库提供领域中共同认可的知识,一般不涉及安全或隐私问题 [19] ;领域
实例数据提供关于个体的知识,可能存在显式的关于个体的敏感或隐私信息.基于领域本体库和领域
实例数据的语义推理,可能揭示隐含的关于个体的敏感或隐私信息.针对领域中涉及安全、敏感或用
户隐私相关的内容,领域安全专家、信息拥有者(例如医院或患者)或信息来源者(例如患者)都可能提
出访问授权的需求,需要基于领域语义知识库建立此访问授权的语义映射.
以上列举的部分语义映射的共性问题,在目前基于本体的知识建模方法、建模工具、知识获取、知识复用
的研究中并未进行深入探讨,这阻碍了本体在各个领域中的广泛应用.为此,本文就以上列举的 3 类语义映射的
共性问题从 5 个方面展开了深入研究,提出了相应的解决方法,总结了 10 条本体建模约定.最后,对这 5 类语义
映射方法进行了应用验证和评价.
本文第 1 节给出相关定义.第 2 节针对上述的 3 类语义映射的共性问题从 5 个方面进行深入探讨,提出相
应的解决方法.第 3 节采用本文提出的语义映射方法构建一个完整的应用案例.第 4 节对本文的方法进行评价.
第 5 节介绍相关研究工作及其存在的不足.最后一节对本文进行总结,并提出进一步的工作.
1 相关定义
定义 1(领域专家知识(domain expert knowledge)或领域专家视图(domain expert view)). 区别于领域大数
据中蕴含的碎片化的或者隐含的领域知识,领域专家知识是指领域专家整理的系统化的、显式的领域专业知识
以及专家积累的领域经验知识,领域专家知识的形态可以是图、表、文字等多种形式.领域专家知识主要是给
人阅读的,而不是计算机可处理的,需要由知识工程师将其映射为领域语义知识库中的知识,以实现领域知识的
共享、集成和复用.记领域专家视图为 EKB domain ,其定义如下:
EKB domain ={ek 1 ,ek 2 ,…,ek i ,…,ek n },n≥1,
其中,ek i 表示其中一位领域专家所贡献的领域知识.
[3]
定义 2(领域本体定义(domain ontology schema)). 领域本体定义 通过捕捉领域中共同认可的概念
(concept)、概念属性、概念分类关系、概念间存在的语义关联关系及相关约束来描述领域知识.记 O domain 表示
领域本体,其定义如下:
O domain =(C,A,R,X,I).
其中,
• C 表示概念(concept)集,概念又称为类(class),用于表达具有某类相似特征的个体(individual)的集合,个
体又称为实例(instance).例如,概念“人(person)”代表所有个体人的集合;
• A 表示所有概念的属性(attribute)集,概念的属性又称为数据类型属性(data type property),它描述概念
所包含的实例本身的特征,例如人的姓名、性别、出生日期、身高、体重等;
• R 表示语义关系(semantic relation)集,语义关系又称为对象属性(object property),包含分类关系
(taxonomic relation)和非分类关系(non-taxonomic relation),即 R=R vtax ∪R hntax :
¾ R vtax 表示概念、属性或语义关系的纵向分类关系,例如,概念“人”可以进一步划分为“男人”和“女
人”两个子概念;
¾ R hntax 表示横向的非分类关系,例如人的个体间存在的好友关系、父子关系、兄弟关系等;
• X 表示公理集,公理(axiom)用于定义概念、属性和关系之上的约束,比如限定概念某个属性的数量(基
数约束)或者在某个属性之上的取值(值约束)、限定属性和关系的定义域(domain)和值域类型(range)
等,例如:人的出生日期只有一个,但不同人可以具有相同的出生日期,人在生物学意义上的父亲和母亲
都是唯一的;出生日期属性的定义域类型为人,值域类型为日期类型等;
• I 表示实例数据集,用于描述领域中共同认可的常识知识,例如内分泌和代谢类疾病包含糖尿病、甲亢