Page 245 - 《软件学报》2020年第9期

P. 245

2866 Journal of Software 软件学报 Vol.31, No.9, September 2020

能从来不会被从这个 RDF 图的外部引用,因此可能不需要通用的标识符.如果需要被从外部引用,则可以创建有
名资源来代替这里的空节点.但在把 RDF 图序列化成三元组形式的时候,需要空节点标识符来表示和区分图中
[4]
的空节点.因此,在三元组表示法中,使用“_:name”形式的空节点标识符来表示空节点 ,例如图 5(b)中的
_:height10338,_:weight10245 和_:disease12227.在使用工具程序(例如 Apache Jena [25] )创建空节点时,可以指定空
节点标识符,也可以由程序自动生成.
与 URIref 和字面值不同,空节点标识符并不被认为是 RDF 图的一个实际组成部分(因为图中的空节点可以
没有空节点标识符).另外,因为空节点标识符表示的是空节点而非弧,所以在一个图的三元组表达式中:空节点
[4]
标识符只能出现在三元组主体和客体的位置上,而不能出现在谓词的位置上 .
结构化值中包含两个或者多个元素,有时领域专家可能想强调某个元素的重要性,例如前面讨论领域专家
在描述某些量化指标时通常省略其单位,因为领域专家认为指标的值更重要,单位在某个语境中很容易达成共
识.这种重要性更多的是一种主观认识,在领域专家的知识中可能不会特意强调,更多地是一种习惯认识.例如,
在描述张三的身高和体重的结构化值中,身高和体重的数值对结构化值的贡献最大,而身高和体重的记录单位
用于修饰身高和体重的数值.在其他类型的结构化值中,可能也存在这样的情况.
[5]
约定 7. 识别专家视图中明确描述或隐含的结构化值的主值(main value) ,在本体视图中使用 RDF 提供的
预定义的属性 rdf:value 来描述结构化值中的主值.
尽管 rdf:value 本身没有含义,但 RDF 鼓励这样使用.如图 5(b)所示,图中属性 pp:people.diagnosis.value 为属
性 rdf:value 的子属性,以表明诊断结果的重要性.

2.5 访问授权的语义映射
针对领域中涉及安全、敏感或用户隐私相关的内容,领域安全专家、信息拥有者(例如医院或患者)或信息
来源者(例如患者)都可能提出访问授权的需求.如何基于领域语义知识库建立此访问授权的语义映射,是本节
要讨论的主题.
所有领域(尤其是医疗健康、金融等领域)都会涉及到与安全、敏感或用户隐私相关的内容 [19,26] .信息共享
与隐私保护的目标是共享数据,同时保护个人身份信息,并确保信息的使用与信息收集的目的相一致.隐私保护
的核心是隐私控制,即信息的拥有者是否有权完全控制个人信息(全部或部分)的收集、访问和共享,并可以要求
停止对个人信息的处理.随着信息化程度的不断提高,越来越多的组织和个人开始担心安全和隐私问题,安全和
隐私也成为信息化时代需要首先解决的关键问题 [19] .
领域专家在建模领域知识的时候,关心的是尽可能全面、详尽、准确、一致地表达领域中的知识;但在提
供知识服务时,领域安全专家必须要考虑领域知识中显式存在的涉及安全、敏感或用户隐私相关的内容的管理
和控制问题,或者可能由推理、授权传播、数据集成、数据挖掘等过程导致的隐含的安全、敏感或隐私信息泄
露问题 [19] .领域本体定义提供领域中共同认可的知识,一般不涉及安全和隐私问题;而领域实例数据描述领域中
个体(比如人、组织等)的知识,会涉及到与个体相关的安全、敏感或隐私问题;但领域本体定义为个体的描述提
供语义支持,并为个体知识的推理提供背景知识.本体描述语言提供的语义描述组件可能为基于推理和数据集
成的安全和隐私泄露提供支持.例如,电子邮件地址通常是唯一的,可以唯一标识一个人,所以描述人的电子邮
件属性一般定义为 owl:InverseFunctionalProperty 类型的,即一个人可以有多个电子邮件,但一个电子邮件地址
可以唯一地确定一个人;一本书的 ISBN 号是唯一的,所以书籍的 ISBN 属性通常定义为 owl:FunctionalProperty
类型的,即一本书可以唯一的确定一个 ISBN 号.在语义 Web 上,可以通过邮件地址聚合关于某个人的很多信息,
通过 ISBN 号可以聚合关于一本书籍及其作者的很多信息,从而可能引发安全和隐私泄露问题.
语义 Web 技术提供的知识表示和推理能力可以增强传统的数据安全和隐私保护能力,并为语义 Web 本身
提供保驾护航.本体模型可以很好地建模领域知识,同样可以细粒度地捕捉领域安全和隐私保护需求.基于本体
建模的领域知识,为发现显式的和隐含的安全和隐私保护需求提供了很好的支持.传统的安全和隐私保护模型
采用增量式的实现方法,没有详细的、一致的形式化模型,不适用于包含大量涉及安全和用户隐私敏感信息的
系统,而本体正好提供了一种可扩展的、灵活的、健壮的形式化模型.使用 SWRL 作为安全策略规范,并基于领

240 241 242 243 244 245 246 247 248 249 250