您的位置:首页 > 其它

Elasticsearch学习(一)

2016-06-13 22:50 197 查看

Elasticsearch简介

Elasticsearch是一个基于Apache Lucene(TM)的开源搜索引擎。无论在开源还是专有领域,Lucene可以被认为是迄今为止最先进、性能最好的、功能最全的搜索引擎库。

但是,Lucene只是一个库。想要使用它,你必须使用Java来作为开发语言并将其直接集成到你的应用中,更糟糕的是,Lucene非常复杂,你需要深入了解检索的相关知识来理解它是如何工作的。

Elasticsearch也使用Java开发并使用Lucene作为其核心来实现所有索引和搜索的功能,但是它的目的是通过简单的RESTful API来隐藏Lucene的复杂性,从而让全文搜索变得简单。

不过,Elasticsearch不仅仅是Lucene和全文搜索,我们还能这样去描述它:

- 分布式的实时文件存储,每个字段都被索引并可被搜索
- 分布式的实时分析搜索引擎
-  可以扩展到上百台服务器,处理PB级结构化或非结构化数据


而且,所有的这些功能被集成到一个服务里面,你的应用可以通过简单的RESTful API、各种语言的客户端甚至命令行与之交互。

安装

安装很简单:1.下载ElasticSearch_版本号.tar.gz,官网上有,下载好之后,直接进入bin目录启动

2. Mac系统直接用brew命令安装。

./elasticsearch 启动

如果想后台运行,则执行 ./elasticsearch -d



检查是否启动成功

lsof -i:9200

lsof -i:9300



RESTful API

ElasticSearch可以提供基于HTTP协议,以JSON为数据交互格式的RESTful API。通过9200端口的与Elasticsearch进行通信,你可以使用你喜欢的WEB客户端,你也可以通过curl命令与Elasticsearch通信。



通过http://localhost:9200/?pretty

可以查看Elasticsearch安装的详细信息,包括版本号,集群名称…

术语和基本的概念

在Elasticsearch中存储数据的行为就叫做索引(indexing)

文档归属于一种类型(type),而这些类型存在于索引(index)中,我们可以画一些简单的对比图来类比传统关系型数据库:

Relational DB -> Databases -> Tables -> Rows -> Columns
Elasticsearch -> Indices   -> Types  -> Documents -> Fields


Elasticsearch集群可以包含多个索引(indices)(数据库),每一个索引可以包含多个类型(types)(表),每一个类型包含多个文档(documents)(行),然后每个文档包含多个字段(Fields)(列)。

「索引」含义的区分

你可能已经注意到索引(index)这个词在Elasticsearch中有着不同的含义,所以有必要在此做一下区分:

索引(名词) 如上文所述,一个索引(index)就像是传统关系数据库中的数据库,它是相关文档存储的地方,index的复数是indices 或indexes。
索引(动词) 「索引一个文档」表示把一个文档存储到索引(名词)里,以便它可以被检索或者查询。这很像SQL中的INSERT关键字,差别是,如果文档已经存在,新的文档将覆盖旧的文档。
倒排索引 传统数据库为特定列增加一个索引,例如B-Tree索引来加速检索。Elasticsearch和Lucene使用一种叫做倒排索引(inverted index)的数据结构来达到相同目的。




分析:

first last age about interest 为Fields
1 为文档
每个文档的类型为tab1。
tab1类型归属于索引 zhj。
zhj 索引存储在Elasticsearch集群中。


通过restful API我们可以查看刚才存储的信息



以上是对Elasticsearch 基础学习,后续会继续补充对其进行分布式增删改查,搜索,结构化查询,分片等等。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息