solr全文检索原理及solr5.5.0 Windows部署
2016-03-23 18:56
344 查看
文章原理链接:http://blog.csdn.net/xiaoyu411502/article/details/44803859
自己稍微总结:全文检索主要有两个过程:创建索引,搜索索引
创建索引:
1.让分词组件分词进行分词处理
2.语言处理组件;主要是对得到的词元(Token)做一些同语言相关的处理
3.将得到的词(Term)传给索引组件(Indexer)。
搜索索引:
1.用户输入查询语句 读懂用户搜索意思
2.对查询语句进行词法分析,语法分析,及语言处理。
3.搜索索引,得到符合语法树的文档。
4.根据得到的文档和查询语句的相关性,对结果进行排序。(显示顺序,排名)
------------------------------------------------------------------------------------------
部署 配合链接如何部署 http://blog.csdn.net/xiaoyu411502/article/details/44835119
1.下载 solr最新 http://apache.opencas.org/lucene/solr/ 我此时是5.5.0版本
2.解压进入目录 \solr-5.5.0\solr-5.5.0\example 查看readme 运行命令bin/solr -e dih
3.打开链接 http://localhost:8983/
4.Solr.xml在加载以后,会去根目录下的每个目录进行搜索,直到遇到一个名为core.properties的文件. 发现core.properties文件的目录被当成一个sorlr的实例
创建一个实例:test1 注意Core Admin弹出层的提示信息:
4.1 咱们拷贝一份已经存在的db目录及内容文件副本,修改名字为test1
4.2 刷新页面可以看到test1
4.3 也可以修改实例的名称:打开test1文件夹下的core.properties文件,添加name=msdb,重新启动进程打开solr命令,则看到msdb
5.操作索引
5.1创建、更新索引
5.2 查询
自己稍微总结:全文检索主要有两个过程:创建索引,搜索索引
创建索引:
1.让分词组件分词进行分词处理
2.语言处理组件;主要是对得到的词元(Token)做一些同语言相关的处理
3.将得到的词(Term)传给索引组件(Indexer)。
搜索索引:
1.用户输入查询语句 读懂用户搜索意思
2.对查询语句进行词法分析,语法分析,及语言处理。
3.搜索索引,得到符合语法树的文档。
4.根据得到的文档和查询语句的相关性,对结果进行排序。(显示顺序,排名)
------------------------------------------------------------------------------------------
部署 配合链接如何部署 http://blog.csdn.net/xiaoyu411502/article/details/44835119
1.下载 solr最新 http://apache.opencas.org/lucene/solr/ 我此时是5.5.0版本
2.解压进入目录 \solr-5.5.0\solr-5.5.0\example 查看readme 运行命令bin/solr -e dih
3.打开链接 http://localhost:8983/
4.Solr.xml在加载以后,会去根目录下的每个目录进行搜索,直到遇到一个名为core.properties的文件. 发现core.properties文件的目录被当成一个sorlr的实例
创建一个实例:test1 注意Core Admin弹出层的提示信息:
instanceDirand
dataDirneed to exist before you can create the core
4.1 咱们拷贝一份已经存在的db目录及内容文件副本,修改名字为test1
4.2 刷新页面可以看到test1
4.3 也可以修改实例的名称:打开test1文件夹下的core.properties文件,添加name=msdb,重新启动进程打开solr命令,则看到msdb
5.操作索引
5.1创建、更新索引
5.2 查询
相关文章推荐
- 异步上传,显示进度条
- web进修之—Hibernate 关系映射(3)
- [转]透过 Linux 内核看无锁编程
- 【bzoj1096】【ZJOI2007】【仓库建设】【斜率优化dp】
- C++扬帆远航——13(个人所得税计算器)
- NYOJ-移动小球
- 第4周项目1-求四个数的最大公约数 a35b
- 如何破解WebLogic管理密码
- Kotlin学习备忘录
- 第三周作业(二)
- Bing Speech Recognition 标记
- SOAP
- KNN python实践
- 【平面面积】HDU1071The area
- Xmanager 5 远程连接linux图形界面
- Js apply 方法 详解
- 2016年,C语言该怎样写
- HDU 2830 移动的矩阵 (思维题)
- 利用js获取当前本地时间和服务器时间
- 四则运算coding