全文检索技术—Solr
2017-01-15 00:22
197 查看
1、什么是Solr
Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器。Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化。
Solr可以独立运行,运行在Jetty、Tomcat等这些Servlet容器中,Solr 索引的实现方法很简单,用 POST 方法向 Solr 服务器发送一个描述 Field 及其内容的 XML 文档,Solr根据xml文档添加、删除、更新索引 。Solr 搜索只需要发送 HTTP GET 请求,然后对 Solr 返回Xml、json等格式的查询结果进行解析,组织页面布局。Solr不提供构建UI的功能,Solr提供了一个管理界面,通过管理界面可以查询Solr的配置和运行情况。
2、Solr和Lucene的区别
![](https://img-blog.csdn.net/20170115001052823?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbGN4MjE2/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
3、Solr的安装
第一步:把solr的压缩包解压缩。、
第二步:安装tomcat。
第三步:把solr-4.10.3\dist目录下的solr-4.10.3.war部署到tomcat下。把war包改名为solr.war(改名不是必须的,为了便于访问)
第四步:解压solr.war,启动tomcat自动解压。关闭tomcat,删除solr.war
第五步:把\solr-4.10.3\example\lib\ext目录下的所有的jar包添加到solr工程中。
第六步:需要一个solrhome,solrhome就是solr服务器所有的配置文件存放的目录。可以使用solr-4.10.3\example\solr目录做为solrhome。
第七步:配置solr服务,指定solrhome的位置。告诉solr服务solrhome在哪儿。需要修改solr工程的web.xml文件。
第八步:启动tomcat。访问:http://localhost:8080/solr/
![](https://img-blog.csdn.net/20170115001332825?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbGN4MjE2/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
4、Solr后台介绍
4.1、Core Admin
在此功能中可以查看solrcore的情况。
4.2、Core selector
在此处可以选择要管理的solrcore。
4.3、Analysis
分析功能。可以查看分析器的分词效果。
4.4、Dataimport
可以配置dataimport插件把数据库中的数据导入到索引库中。
4.5、Documents
可以使用此功能实现索引库的维护,增删改功能。
4.6、Query
查询索引库。
5、SolrJ的使用
Solr的客户端。
5.1、添加文档:
第一步:创建一个java工程。
第二步:把solrJ相关的jar包添加到工程中。
第三步:使用SolrServer和solr服务端创建一个连接。SolrServer是一个抽象类,单机版使用HttpSolrServer,如果solr集群,使用CloudSolrServer。
第四步:创建一个文档对象SolrInputDocument对象。
第五步:向文档对象中添加域。必须包含id域,域名称必须在schema.xml中定义。
第六步:使用SolrServer对象把文档添加到索引库。
第七步:提交。Commit。
5.2、删除文档:
根据id删除;
根据查询删除
5.3、更新文档:
5.4、查询文档:
简单查询;
复杂查询
Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器。Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化。
Solr可以独立运行,运行在Jetty、Tomcat等这些Servlet容器中,Solr 索引的实现方法很简单,用 POST 方法向 Solr 服务器发送一个描述 Field 及其内容的 XML 文档,Solr根据xml文档添加、删除、更新索引 。Solr 搜索只需要发送 HTTP GET 请求,然后对 Solr 返回Xml、json等格式的查询结果进行解析,组织页面布局。Solr不提供构建UI的功能,Solr提供了一个管理界面,通过管理界面可以查询Solr的配置和运行情况。
2、Solr和Lucene的区别
3、Solr的安装
第一步:把solr的压缩包解压缩。、
第二步:安装tomcat。
第三步:把solr-4.10.3\dist目录下的solr-4.10.3.war部署到tomcat下。把war包改名为solr.war(改名不是必须的,为了便于访问)
第四步:解压solr.war,启动tomcat自动解压。关闭tomcat,删除solr.war
第五步:把\solr-4.10.3\example\lib\ext目录下的所有的jar包添加到solr工程中。
第六步:需要一个solrhome,solrhome就是solr服务器所有的配置文件存放的目录。可以使用solr-4.10.3\example\solr目录做为solrhome。
第七步:配置solr服务,指定solrhome的位置。告诉solr服务solrhome在哪儿。需要修改solr工程的web.xml文件。
第八步:启动tomcat。访问:http://localhost:8080/solr/
4、Solr后台介绍
4.1、Core Admin
在此功能中可以查看solrcore的情况。
4.2、Core selector
在此处可以选择要管理的solrcore。
4.3、Analysis
分析功能。可以查看分析器的分词效果。
4.4、Dataimport
可以配置dataimport插件把数据库中的数据导入到索引库中。
4.5、Documents
可以使用此功能实现索引库的维护,增删改功能。
4.6、Query
查询索引库。
5、SolrJ的使用
Solr的客户端。
5.1、添加文档:
第一步:创建一个java工程。
第二步:把solrJ相关的jar包添加到工程中。
第三步:使用SolrServer和solr服务端创建一个连接。SolrServer是一个抽象类,单机版使用HttpSolrServer,如果solr集群,使用CloudSolrServer。
第四步:创建一个文档对象SolrInputDocument对象。
第五步:向文档对象中添加域。必须包含id域,域名称必须在schema.xml中定义。
第六步:使用SolrServer对象把文档添加到索引库。
第七步:提交。Commit。
5.2、删除文档:
根据id删除;
根据查询删除
5.3、更新文档:
5.4、查询文档:
简单查询;
复杂查询
相关文章推荐
- solr全文检索(第一篇 安装测试)--源自技术
- solr全文检索技术学习(一)-核心配置文件solrconfig.xml
- solr全文检索(第二篇 solr的实例)--源自技术
- solr全文检索技术学习(二)-schema.xml配置解析
- solr全文检索(第三篇 数据导入)--源自技术
- 全文检索技术---solr
- 全文检索技术 solr(三)solr安装、启动
- 全文检索技术---solr
- solr全文检索技术学习(三)-搭建SolrCloud集群问题总结
- 全文检索技术-lucene,solr,nutch,hadoop,可见nutch除了做爬虫,还可以实现全文检索
- 全文检索技术--solr
- 图解全文检索SOLR的酷应用[Ajax Solr]
- howto:solr全文检索配置
- SQL Server 2005全文检索技术在网站上的应用实录 索引
- 全文检索 -- Solr从概念到实战(一)
- 全文搜索技术——Solr与solrj使用教程
- solr中文全文检索
- SOLR--7--传统关系型数据库在全文检索中的劣势
- 使用solr搭建你的全文检索
- Solr全文检索服务器搭建与基本使用介绍