Page 251 - 《软件学报》2020年第9期
P. 251
2872 Journal of Software 软件学报 Vol.31, No.9, September 2020
Table 2 Conventions followed by the domain commonsense knowledge definitions
表 2 领域常识知识定义遵循的约定
遵循约定 说明
O medicine 本体中部分实例资源具有多种类型,例如糖尿病、泌尿道感染等实例既是一种疾病,
约定 3
也是其他疾病的风险因素、病因或表现症状.对于这些实例的定义遵循约定 3,参见图 2 所示.
O exercise 本体中所有运动项目都可以按照能量代谢类型、运动的益处、运动的技术结构和
运动的强度进行分类,在进行语义映射时遵循约定 4,针对运动项目实例,只建立了一个
约定 4
运动项目一级分类,并将所有运动项目建模为其实例;而将专家视图中的不同特化分类建模
为类型实例,同时增加多个对应的分类属性来连接运动项目实例和这些类型实例,参见图 3 所示.
在定义疾病、解剖结构、症状、运动项目、食材等概念和实例时,部分资源
约定 5 既是类型又是实例,这时遵循约定 5 的方法建立语义映射,采用 OWL DL
来描述本体视图,参见图 4(b)和图 10,以确保推理计算的完全性和可判定性.
以 Turtle RDF [40] 表示的领域语义知识库的文件(扩展名为.ttl)大小约为 1.8GB,知识库中包含 144 个概念、
82 个数据类型属性、166 个对象属性、888 308 个实例和 7 076 316 个三元组.
该知识库的规模和内容可以满足临床科研、临床诊疗、健康管理中一些基本的知识服务需求,例如提供数
据的共享与互操作服务.在健康医疗领域中,同一种疾病、同一种症状等在不同医疗机构可能有不同的描述方
法,甚至在同一医疗机构也存在许多不同的描述方法.这些不同描述方法与标准描述方法的归一化是一项知识
密集型、时间密集型的工作.但此项工作不解决,领域知识库的作用便不能得到有效地发挥.为向领域应用提供
智能知识服务,还需要结合特定领域的问题求解需求,补充问题求解知识,知识的形态可以是语义 Web 规则集
(参见第 3.3 节)、算法、模型等.
3.2 领域实例库的构建
为了对知识库在问题求解上的可满足性进行验证,这里以推荐个性化运动处方场景为例,分别定义了 3 个
个体的实例数据,即个体张三、李四、王二的实例数据,包括他们的基本信息(性别、年龄、身高、体重)、健康
状况(患病情况、残疾情况、损伤情况)、兴趣爱好(运动、饮食等)、日常体力活动水平、生活习惯、具有的运
动条件(场地、设备、经济条件等).领域实例库 IB healthcare 定义如下:
IB healthcare ={I zhangsan ,I lisi ,I wanger }.
在定义个体实例数据时遵循的约定见表 3.
Table 3 Conventions followed by the individual instance data definitions
表 3 个体实例数据定义遵循的约定
遵循约定 说明
在基于领域本体库 OB healthcare 描述张三、李四和王二的年龄、身高、体重等结构化值时,
约定 6 和 遵循约定 6 和约定 7,参见图 5 所示.这里,个体的患病情况是一个确定值,作为干预方案
约定 7 推荐时考虑的一个条件,直接使用属性 pp:people.person.diseases 来连接个体及其所患疾病.
结构化值中的年龄值、身高值、体重值等作为主值,度量单位作为附加信息
在使用 Protégé 定义对象属性的值域、实例间的语义关系和个体实例数据时,需要引用或导入(owl:imports)
关联本体中的概念和实例,本体间的引用关系如图 11 所示.
food people exercise
measure
ment_unit medicine location
Fig.11 Reference relations between ontologies
图 11 本体间的引用关系