您的位置:首页 > 其它

资源描述框架语言RDF

2012-11-30 15:50 197 查看
海量网络信息难以被计算机自动处理,解决途径:用元数据来索引网络上的信息,然后使用RDF来描述元数据以及元数据与元数据之间的关系。

  元数据:关于数据的数据,用来描述网络资源的数据。(Data Dictionary?)

      

  1.资源描述框架模型

   通过Property和Value来描述资源以及资源之间的关系。类似于E-R?

      

  1.1模型表示

   图示法,模型和三元组,资源以资源标识符来标识,资源标识符由一个唯一资源标识符和一个可选的锚(Auchor)ID组成。

   三元组:Subject、Predicate、Object {P,S,O}

   实例:{创建者,[http://e.pku.edu.cn],”北大网络实验室”}

   图示法:Resource:椭圆、Property:箭头、Literal:矩形

   句式:“<主体>的<谓词>是<客体>” or “<资源>的<属性>是<文本>”(文本可以是一个常量,也可以拓展为一个结构化实体,即另一个资源)

      

  1.2RDF模型的组成

   通过给定的性质和性质的值来描述资源之间的联系,定义了由Resource、Property、Statement3种对象组成的基本模型。通过该抽象数据模型为定义和使用元数据建立了一个框架,元数据元素可看成其描述的资源的性质。

   Resource Definition:所有能用RDF表达式来描述的事物,通常由一个惟一资源标识符(URI)加上一个可选的锚ID(引用锚-”#ID”)的形式来表示;

   Property Definition:用来描述资源的某一个特定方面,有其特定的含义;

   Statement Definition:由一个特定的资源和一个指定的性质以及资源的这个性质的取值组成,即面的R、P、L。客体具有多样性,可以是一个常量,也可以是另一个资源。

      

  1.3RDF模型基本结构:

   以XML为语法基础,沿用了NameSpace的思想,在RDF中可以引用已定义的RDF模式,从而实现复用。

      

  1.4RDF语法

   RDF数据模型的两种XML语法:Serialization Syntax 和 Abbreviation Syntax。前者以形式化的方法描述了RDF数据模型的全部功能;而后者提供了简洁的形式来表示RDF数据模型的一部分。

      

   序列化语法(Serialization Syntax):

   单个RDF语句很少单独出现,通常是同时给出一个资源的多个性质,在RDF/XML语法中,关于同一个资源的多个语句被聚合到一个Description元素中。Description元素在它的about属性中对这些语句共同描述的那个资源进行命名;若该资源尚不存在,可以用ID属性为该资源提供一个ID。

   语法:

  


   

  ID属性表示一个新资源的创建,而about属性引用了一个已存在的资源。两者都可以出现在Description中而不能同时出现。同一个文档中每个ID属性的取值不能出现多于一次。

  性质的名称必须和一个模式Schema相关联(见:[10] Qname::=[ NSprefix ‘:’] name)。通常使用一个命名空间前缀来验证元素名是否合法,从而明确地将性质的定义与相应的RDF模式连接起来,或者按照XML中命名空间的定义来定义一个缺省的命名空间。

  简略语法(Abbreviation Syntax):

   优势:允许遵循高度结构化的XML DTD文档可以直接被解释成RDF模型。

   三种形式:

   (1)适用于Description中的性质没有重复出现,且这些性质的取值都是常量的情况。在这种情况下:性质写成Description元素的XML属性。

   (2)针对内嵌的Description元素而设计,适用于:语句的客体是另一个资源,而第二个资源所有给出的性质的取值都是字符串。在这种情况下:将内嵌的Description中的资源的性质改写为包含该Description的propertyElt元素的XML属性。

   (3)使用于:Description元素中包含了一个type性质的情况。在这种情况下:对应于type性质的值的模式中定义的资源类型可以直接用来作为元素名

  综合得到基本简略语法如下:

  








<

border=0>





3.语句的复合

  RDF语句的复合(Statement about statement)——一个语句是关于另一个语句的说明,称为高阶语句。需要为原语句建立一个模型,该模型是一个新资源。例如:李教授说北大网络实验室是资源http://e.pku.edu.cn/的创建者。

  “北大网络实验室是资源http://e.pku.edu.cn/的创建者”是一个语句,“李教授说……”是另一个语句。

  用RDF表示这个事实所采取的措施:将原始语句建模为一个拥有4个性质的资源——知识发现领域的具体化(Reification),该模型称为具体化语句(Reified Statement)。

3.1 Reification

  RDF定义如下4个性质:

   (1)主体(Subject):主体性质标识了正在被该语句描述的资源;

   (2)谓词(Predicate):谓词性质标识了该语句的原始性质;

   (3)客体(Object):客体性质标识了该语句中性质的值;

   (4)类型(Type):类型性质的值描述了新资源的类型。默认所有的具体化语句都是RDF语句(Statement)的实例,即它们都有一个客体为RDF:Statement的类型性质。

  拥有以上4个性质的新资源表示原始语句,可以作为其他语句的客体,不过它不是原始语句的替代,而是该语句的模型。一个语句和它相应的具体化语句在RDF图中是彼此独立存在的,当且仅当这个语句出现在RDF图中时,RDF图才包含语句中给出的事实,而不考虑相应的具体化语句是否出现在RDF图中。

3.2语句复合的简写

  对上例“李教授说北大网络实验室是资源http://e.pku.edu.cn/的创建者”进行建模,为具体化语句添加一个性质“attributeTo”,赋值为“李教授”。RDF/XML语法书写如下:

  



3.3具体化与包的关系

  一个包中包含的是若干个资源的集合,一个具体化语句是一个新的资源,把两者结合起来,那么一个包中可以包含若干个具体化语句。

  如果想在模型中清楚地表示出根据Description元素聚集到一起的语句分组,需要用到具体化。Description中的每个成员被具体化,每个被具体化的语句是表示Description的Bag的一个成员。如:

  



  ID和BagID:ID标识一个内嵌资源,资源的性质将在Description中详细介绍;BagID标识一个容器资源,,该资源的成员是关于另一个资源的所有被具体化的语句。Description中可以同时包含ID以及BagID。

  

复合语句的简写句法

  例句:李教授说北大网络实验室是http://e.pku.edu.cn/的创建者,并且该资源的标题是“天网搜索引擎主页”,创建该符合语句时,可以利用BagID简写如下:

  



第4节RDF形式化表示和第5节RDF模型论暂且没有细看。模型论确实有点过于晦涩了,写书的人也没有来点引论什么的,直接就切入正题了,所以只得暂且搁下。到时候粗略看完了全书再回过头研究这个吧:)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐