您的位置:首页 > 其它

全文检索技术—Solr

2017-01-15 00:22 197 查看
1、什么是Solr

Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器。Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化。 

Solr可以独立运行,运行在Jetty、Tomcat等这些Servlet容器中,Solr 索引的实现方法很简单,用 POST 方法向 Solr 服务器发送一个描述 Field 及其内容的 XML 文档,Solr根据xml文档添加、删除、更新索引 。Solr 搜索只需要发送 HTTP GET 请求,然后对 Solr 返回Xml、json等格式的查询结果进行解析,组织页面布局。Solr不提供构建UI的功能,Solr提供了一个管理界面,通过管理界面可以查询Solr的配置和运行情况。
2、Solr和Lucene的区别



3、Solr的安装

第一步:把solr的压缩包解压缩。、

第二步:安装tomcat。

第三步:把solr-4.10.3\dist目录下的solr-4.10.3.war部署到tomcat下。把war包改名为solr.war(改名不是必须的,为了便于访问)

第四步:解压solr.war,启动tomcat自动解压。关闭tomcat,删除solr.war

第五步:把\solr-4.10.3\example\lib\ext目录下的所有的jar包添加到solr工程中。

第六步:需要一个solrhome,solrhome就是solr服务器所有的配置文件存放的目录。可以使用solr-4.10.3\example\solr目录做为solrhome。

第七步:配置solr服务,指定solrhome的位置。告诉solr服务solrhome在哪儿。需要修改solr工程的web.xml文件。

第八步:启动tomcat。访问:http://localhost:8080/solr/



4、Solr后台介绍

4.1、Core Admin

在此功能中可以查看solrcore的情况。

4.2、Core selector

在此处可以选择要管理的solrcore。

4.3、Analysis

分析功能。可以查看分析器的分词效果。

4.4、Dataimport

可以配置dataimport插件把数据库中的数据导入到索引库中。

4.5、Documents

可以使用此功能实现索引库的维护,增删改功能。

4.6、Query

查询索引库。

5、SolrJ的使用

Solr的客户端。
5.1、添加文档:

第一步:创建一个java工程。

第二步:把solrJ相关的jar包添加到工程中。

第三步:使用SolrServer和solr服务端创建一个连接。SolrServer是一个抽象类,单机版使用HttpSolrServer,如果solr集群,使用CloudSolrServer。

第四步:创建一个文档对象SolrInputDocument对象。

第五步:向文档对象中添加域。必须包含id域,域名称必须在schema.xml中定义。

第六步:使用SolrServer对象把文档添加到索引库。

第七步:提交。Commit。
5.2、删除文档:

根据id删除;

根据查询删除
5.3、更新文档:
5.4、查询文档:

简单查询;

复杂查询
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: