Page 249 - 《软件学报》2020年第9期
P. 249

2870                                 Journal of Software  软件学报 Vol.31, No.9,  September 2020

         准术语集诞生的背景和应用场景的不同,它们中的一些概念分支存在重叠,但又不完全一样,例如,关于疾病、症
         状、运动设施等的分类体系有部分重叠.而且部分概念同时出现在多个分支,但表达的语义不一样.为此,由医学
         专家针对本文的应用场景对其进行了整合.
             在列举的几个公开知识库中,除了 Freebase 以外的几个知识库仍然以概念分类体系为主,而 Freebase 正好
         相反,只有一级概念,以实例关系为主,实例关系主要用于表达领域常识知识,例如某个疾病的主要表现症状、诱
         因、风险因素等.同时,Freebase 知识库中还包含了度量单位、位置领域的知识.
             在例举的几个公开项目中,K4CARE 项目中定义的 CPO(case profile  ontology)本体用于描述患者病情概况
         所需要的知识,比如症状、体征、疾病、综合征、社会问题等及其语义关系,其中,疾病仅仅涵盖了一些慢性病.
         PIPS 项目中创建了疾病(doid.rdf)、临床记录(PIPSClinicalRecord.owl)、食物(PIPSFood.owl)、菜单(PIPSMenu.
         owl)、菜谱(PIPSRecipe.owl)、个人概况(PIPSPerson.owl)等本体,但主要是概念分类体系.
             列举的论文文献和专业著作主要用于提供运动、饮食相关的专家知识,也从网络上收集了一些资料.
             为此,基于本文提出的语义映射方法,由医学专家参与,针对本文的应用场景对几个来源的概念体系进行了
         整合,实例数据主要参考 Freebase 知识库(并保留了实例数据的 MID)、K4CARE 项目和相关文献.除了 Freebase
         知识源以外,其他标准术语集、知识库和公开项目中的知识均为英文描述.Freebase 知识库中的资源对象,其标
         注属性采用了 20 多种语言分别进行描述.Freebase 知识库中的所有资源对象都具有英文描述,但只有约一半的
         资源对象具有中文描述.为此,在建立领域语义知识库时,对于参考的英文素材,在保留英文描述的同时,还采用
         翻译工具对其进行了中文翻译,并由医学专家对其进行了校对.对于医学专家补充的知识,只有中文描述.
             领域本体库 OB healthcare 的定义如下:
                            OB healthcare ={O medicine ,O people ,O food ,O exercise ,O measurement_unit ,O location }.
             各个子本体说明如下.
             1)   O medicine 用于定义医疗健康领域的相关概念(例如疾病、症状、检查、药物、手术、解剖结构、病因、
                 医疗设备等)及其属性(例如疾病概念包含的部分属性有疾病表现的症状、疾病适用的药物、疾病病
                 因、疾病并发症、疾病包含的子疾病、疾病归属的父疾病等);
             2)   O people 用于定义与人相关的概念(例如人、人群、孩子、父母、儿子、女儿、父亲、母亲等)及其属
                 性(例如人的部分属性有性别、出生日期、身高、体重、有身体残疾、有身体损伤、感兴趣/适合/
                 不适合的运动、感兴趣/适合/不适合的饮食等);
             3)   O food 用于定义与食材、食谱相关的概念(例如食材、食谱、中医功效、营养素、坚果种子、奶、水
                 产、水果、油脂、糖品、肉等)及其属性(例如食材包含的营养素、食材功效、食材适宜摄入量、食
                 材推荐摄入量、营养素计量单位、营养素参考值等);
             4)   O exercise 用于定义康复运动相关的概念(例如运动项目、运动设备、运动强度、能量代谢类型、运动
                 益处等)及属性(例如运动项目需要的运动设备、运动项目包含的子运动项目、运动项目归属的父运
                 动项目、运动项目的能量代谢类型、运动项目的运动强度、运动项目的运动益处、运动项目的锻炼
                 部位、运动项目依赖的运动场地等);
             5)   O measurement_unit 包含度量相关的概念(例如长度单位、质量单位、时间单位、货币单位等)及其属性(例
                 如长度计量单位、长度计量单位的标准缩写等);
             6)   O location 包含地理位置、场所相关的概念(例如地址、邮编、洲、国家、省、市、县、镇、场所、部
                 门等)及其属性(例如编码、名称、包含关系、隶属关系等).
             领域本体库 OB healthcare 中的主要概念及其属性关系如图 10 所示,其中,椭圆表示概念,带箭头的连线表示属
         性,箭头源端连接的概念表示该属性的定义域,箭头目的端连接的概念表示该属性的值域.
             在定义各个子本体时遵循的约定见表 1.
   244   245   246   247   248   249   250   251   252   253   254