准备solr搭建搜索的学习笔记
2015-04-23 14:47
344 查看
一,安装部署solr
1. 下载tomcat解压,这里选择的是tomcat8
2. 下载solr最新版本(4.10.1)并解压solr文件夹下,下载地址是http://lucene.apache.org/solr/。 并将解压后solr\example\solr中的内容拷贝至的solrHome\下
3. 将solr解压后的solr\dist\solr-4.10.1.war 拷贝至apache-tomcat-8.0.12\webapps目录,并重命名为solr.war。
4. 在apache-tomcat-8.0.12\conf\server.xml中配置solr的Context,顺便修改端口号8080为80
5. 启动tomcat,并访问solr:http://localhost/solr,页面显示404,并在localhost日志中可以看到错误信息
6. 将solr\example\lib\ext下的jar文件件,拷贝至apache-tomcat-8.0.12\webapps\solr\WEB-INF\lib下
7. 重新启动,并访问solr
测试分词效果
二,为solr增加用户验证
1. 在tomcat的apache-tomcat-8.0.12\conf\tomcat-users.xml 添加用户角色并指定访问的用户名密码
2. 在apache-tomcat-8.0.12\webapps\solr\WEB-INF\web.xml中添加用户访问权限设置
三、为solr添加中文分词
1. 在不做任何改动的情况下,做中文分词如下
2. 此次为solr进行中文分词,选择的组件是mmseg4j,开源地址是:https://github.com/chenlb/mmseg4j-solr
mmseg4j支持最多分词,是一款很优秀的中文分词器,是用Chih-Hao Tsai 的 MMSeg 算法( http://technology.chtsai.org/mmseg/ )实现的中文分词器,并实现 lucene 的analyzer 和 solr 的TokenizerFactory 以方便在Lucene和Solr中使用。
3. 下载中文分词需要依赖的jar包,放于apache-tomcat-8.0.12\webapps\solr\WEB-INF\lib下
1. mmseg4j-for-solr(mmseg4j-solr-2.2.0.jar) 2. mmseg4j-core(mmseg4j-core-1.10.0.jar)
4. 修改solr_home\collection1\conf\schema.xml,
4.1 添加如下代码,代码片段可以从https://github.com/chenlb/mmseg4j-solr中直接拷贝,可修改dicPath 参数 -
设置自定义的扩展词库,支持相对路径(相对于 solr_home).
4.2 更改原有配置,使原有一些重要的字段从英文分词器换成中文分词器,使之支持中文分词
5. 重启tomcat查看效果
四、 Solr后台的使用
略,这里可以自己先了解一下,功能一目了然
五、SorlJ的使用
添加solrj的jar文件
1. 下载tomcat解压,这里选择的是tomcat8
2. 下载solr最新版本(4.10.1)并解压solr文件夹下,下载地址是http://lucene.apache.org/solr/。 并将解压后solr\example\solr中的内容拷贝至的solrHome\下
3. 将solr解压后的solr\dist\solr-4.10.1.war 拷贝至apache-tomcat-8.0.12\webapps目录,并重命名为solr.war。
4. 在apache-tomcat-8.0.12\conf\server.xml中配置solr的Context,顺便修改端口号8080为80
7. 重新启动,并访问solr
测试分词效果
二,为solr增加用户验证
1. 在tomcat的apache-tomcat-8.0.12\conf\tomcat-users.xml 添加用户角色并指定访问的用户名密码
三、为solr添加中文分词
1. 在不做任何改动的情况下,做中文分词如下
2. 此次为solr进行中文分词,选择的组件是mmseg4j,开源地址是:https://github.com/chenlb/mmseg4j-solr
mmseg4j支持最多分词,是一款很优秀的中文分词器,是用Chih-Hao Tsai 的 MMSeg 算法( http://technology.chtsai.org/mmseg/ )实现的中文分词器,并实现 lucene 的analyzer 和 solr 的TokenizerFactory 以方便在Lucene和Solr中使用。
3. 下载中文分词需要依赖的jar包,放于apache-tomcat-8.0.12\webapps\solr\WEB-INF\lib下
1. mmseg4j-for-solr(mmseg4j-solr-2.2.0.jar) 2. mmseg4j-core(mmseg4j-core-1.10.0.jar)
4. 修改solr_home\collection1\conf\schema.xml,
4.1 添加如下代码,代码片段可以从https://github.com/chenlb/mmseg4j-solr中直接拷贝,可修改dicPath 参数 -
设置自定义的扩展词库,支持相对路径(相对于 solr_home).
4.2 更改原有配置,使原有一些重要的字段从英文分词器换成中文分词器,使之支持中文分词
5. 重启tomcat查看效果
四、 Solr后台的使用
略,这里可以自己先了解一下,功能一目了然
五、SorlJ的使用
添加solrj的jar文件
相关文章推荐
- Solr学习笔记三--更新文档搜索
- Solr学习笔记一 ---Solr运行环境搭建(tomcat7 + solr 3.5 +ubuntu 10.04)
- Solr学习笔记之1、环境搭建
- 【Solr4.7.0学习笔记】系列之一:Tomcat7中搭建Solr 4.x(4.7.0)
- 开始hadoop前的准备:ubuntu学习笔记-基本环境的搭建(ssh的安装,SecureCRT连接,vim的安装及使用、jdk的安装)
- 搜索-Solr学习笔记
- Spring 、SpringMVC、Mybatis、MySQL、Maven、Tomcat搭建JavaWeb项目流程---学习笔记(一)工具准备及环境配置
- Angular4学习笔记之准备和环境搭建项目
- Solr6.2.1 学习笔记(一)搭建运行环境(两种方式)
- hadoop学习准备环境:ubuntu学习笔记-基本环境的搭建
- 基于Solr的空间搜索学习笔记
- android 学习笔记(七)android底层学习的一些准备7.1 攻城狮编辑利器vim环境的搭建
- solr学习笔记 -- day06 模拟京东实现站内搜索
- 深度学习框架Caffe学习笔记(1)-Caffe环境搭建
- Tiny6410 学习笔记(二)搭建u-boot框架
- 迅为4412开发板学习笔记-TFTP服务器的搭建
- 【python学习笔记】1.python环境搭建
- Adroid学习笔记-入门资料以及V2.3系统开发环境搭建
- Python学习笔记(二)----Python环境搭建
- 学习淘淘商城第三十九课(搜索系统搭建)