您的位置:首页 > 其它

本体的理解

2017-09-26 11:29 155 查看
以下是对漆桂林老是解答的一些摘要

“本体(Ontology),在维基百科的定义是:

In computer science and information science, an ontology is a formal naming and definition of the types, properties, and interrelationships of the entities that really or fundamentally exist for a particular domain of discourse. It is thus a practical application of philosophical ontology, with a taxonomy.


我浅显的理解,本体就是这个知识库本身的存在,也就是知识库中对知识的一个定义,定义这个知识库中具体的每一个知识到底是什么。【本体论(英语:Ontology),又译存在论、存有论,它是形而上学的一个基本分支,本体论主要探讨存有本身,即一切现实事物的基本特征。】就好像有一匹马叫赤兔,那么马这个概念才是本体,赤兔红兔什么的无所谓;有一个美女叫貂蝉,那么美女这个概念才是本体,貂蝉西施啊什么的也无所谓。题主你能理解我说的是什么么,我再说一次我觉得本体就是知识库本身的存在,和里面的数据没有关系。感觉我这个表达能力真是差啊T_T。。。

以Freebase为实例,Freebase里众多的entity每一个都代表了一个真实的概念或者实体。比如实体观海同志(Barack Obama),你可以看到观海同志是一个实体,他有名字,他是一个实实在在的存在。那么这个存在的本质是什么呢?观海同志首先是一个人,那么知识库中必然有一个定义,叫做人,人就是上面定义的一个type。人还有属性,比如性别,年龄,这些就是上面定义里的property。观海同志还有第一夫人,那么观海同志及其夫人之间就有一个配偶关系,这个关系就是上面的interrelationships 。本体就是这些概念,计算机科学里本体其实就可以看成关系数据库里的关系模式,也就是一个关系和数据的描述系统。

从抽象层面看,本体最抽象,其次是知识库,最后才是知识图谱。举个例子,如果我们要做图书领域的知识库或者知识图谱,首先要对图书进行分类,这个分类就是本体,比如说,图书分为计算机类和电子类,计算机类有分为网络、人工智能;有了这个分类后,我们就可以把图书都分到每个类别,比如说《Zero to One》是一本进口原版书,然后这本书有各种属性-属性值,比如说书的作者是Peter Thiel,这些数据就构成了一个图书知识图谱(前面讲的分类可以认为不是这个知识图谱的一部分),而这里分类和知识图谱一起可以看成是一个图书知识库。也就是说,本体是强调概念关系,知识图谱强调实体关系和实体属性值,知识库则是所有知识的集合。但是知识库不局限于分类和图谱,知识库可以包括规则,包括过程性知识等。而本体也可以定义得很抽象,任何概念的内涵和外延可以定义本体。



理解了部分漆老师的话之后自己的一些理解,忘指摘:

本体,它是一个具体的东西吗,如果所有人的世界观都相同,这个概念是人造的,并且很明确的得到了表达,那这个本体就可以很具体并且它就是很具体的,但是世界上的很多东西没有严格的定义。

比如我们认为“赤兔马”是一个本体,且在我们的本体构建时有两匹赤兔马,一个赤兔马叫做“A”,另一个赤兔马叫做“B”

在建立本体时,A马和B马可能就是两个本体,且这两个本体只有名字不同,他们都是赤兔马,这就把本体都具体化了。

但是为什么又说本体是不可以具体化的呢,因为如果大家对赤兔马的认知都仅限于名字,和品种,那么这两个本体确实是只能通过名字区别。

但是在现实生活中,大部分的事物都不是我们能够很深刻的理解的。我们只能够用一堆概念、约束来形容它。名字仅仅是用来标识它。本体的构建就是把我们对某个事物的认识具体、具体、再具体。而本体的实际实际上就是抽象、抽象、再抽象的。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  本体