solr(三)---多core配置
2014-11-09 15:19
232 查看
一、为何使用多core?
Solr实例支持多core比启用多index要好(do more)。多core同时解决了在生产环境下的一些关键需求:
1.重建索引
2.测试配置变更
3.合并索引
4.运行时重命名core
Solr Multicore 是 solr 1.3 的新特性。其目的一个solr实例,可以有多个搜索应用。
我们既可以把不同类型的数据放到同一index中,也可以使用分开的多indexes。基于这一点,你只需知道如何使用多 indexes(实际上就是运行Solr的多实例)。尽管如此,为每一个类型添加一个完整的Solr实例会显得太臃肿庞大。
Solr1.3引入了Solr core的概念,该方案使用一个Solr实例管理多个indexes,这样就有热点core(hot core)的重读(reloading)与交换(swap,通常是读index与写index交换),那么管理一个 core或index也容易些。每个Solr core由它自己的配置文件和索引数据组成。在多core执行搜索和索引几乎和没有使用core一样。你只是添加core的名字为各自不同的URL。单core情况下的如下搜索: http://localhost:8080/solr/select?q=dave%20matthews 在多core环境下,你可以通过如下方式访问一个名为core1的core:
localhost:8080/solr/core1/select?q=name:Extreme
并非在URL中引入core name的参数名值对,而是用不同的context。这样就可以像在单core中执行你的管理任务,搜索,更新操作。
二、多core的配置
2.1、在主目录创建core相关文件和文件夹
在\example目录下有一个multicore的文件夹(笔者的路径是F:\solr\solr-4.7.2\example\multicore)。这里配置了两个core,分别是core0和core1。把这两个文件夹复制进主目录中。因为主目录中本来有了默认的core(collection1),所以现在将有三个core同时存在。
2.2、修改solr.xml
包含三个core的solr.xml如下所示:
一些关键的配置值是:
A)、Persistent="false"指明运行时的任何修改我们不做保存。如拷贝。如果你想保存从启动起的一些改动,那就把 persistent设置为true。如果你的index策略是完成建index到一个纯净的core中然后交换到活动core 那么你绝对应该设为true。
B)、sharedLib="lib"指明了所有core的jar文件的lib目录。如果你有一个core有自己需要的jar文件,那么你可以把他们置入到core/lib目录。例如:karaoke core 使用 Solr Cell来索引化富文本内容,因此那些用来解析和抽取富文本的jar文件被放到./examples/cores/karaoke/lib/.
2.3、运行
如果上面的配置都正常的话,基本的配置都ok了!那我们重启tomcat,打开admin界面。
从“Core Selection”上可以看到我们已经配置好的三个core。而对他们的操作在《solr(二)---基本使用》已经介绍过了。如果不太清楚的,可以去看看笔者的这篇博文。
多个core的配置已经好了,我们就可以根据不同的需求、对不同的core进行不同的配置、实现不同目的的搜索了!
Solr实例支持多core比启用多index要好(do more)。多core同时解决了在生产环境下的一些关键需求:
1.重建索引
2.测试配置变更
3.合并索引
4.运行时重命名core
Solr Multicore 是 solr 1.3 的新特性。其目的一个solr实例,可以有多个搜索应用。
我们既可以把不同类型的数据放到同一index中,也可以使用分开的多indexes。基于这一点,你只需知道如何使用多 indexes(实际上就是运行Solr的多实例)。尽管如此,为每一个类型添加一个完整的Solr实例会显得太臃肿庞大。
Solr1.3引入了Solr core的概念,该方案使用一个Solr实例管理多个indexes,这样就有热点core(hot core)的重读(reloading)与交换(swap,通常是读index与写index交换),那么管理一个 core或index也容易些。每个Solr core由它自己的配置文件和索引数据组成。在多core执行搜索和索引几乎和没有使用core一样。你只是添加core的名字为各自不同的URL。单core情况下的如下搜索: http://localhost:8080/solr/select?q=dave%20matthews 在多core环境下,你可以通过如下方式访问一个名为core1的core:
localhost:8080/solr/core1/select?q=name:Extreme
并非在URL中引入core name的参数名值对,而是用不同的context。这样就可以像在单core中执行你的管理任务,搜索,更新操作。
二、多core的配置
2.1、在主目录创建core相关文件和文件夹
在\example目录下有一个multicore的文件夹(笔者的路径是F:\solr\solr-4.7.2\example\multicore)。这里配置了两个core,分别是core0和core1。把这两个文件夹复制进主目录中。因为主目录中本来有了默认的core(collection1),所以现在将有三个core同时存在。
2.2、修改solr.xml
包含三个core的solr.xml如下所示:
<solr persistent="true" sharedLib="lib"> <property name="snapshooter" value="/home/solr-user/solr/bin/snapshooter.sh" /> <!-- adminPath: RequestHandler path to manage cores. If 'null' (or absent), cores will not be manageable via request handler --> <cores adminPath="/admin/cores" host="${host:}" hostPort="${jetty.port:8983}" hostContext="${hostContext:solr}"> <core name="collection1" instanceDir="collection1"> <property name="dataDir" value="E:\solr-tomcat\solr\data\collection1" /> </core> <core name="core0" instanceDir="core0"> <property name="dataDir" value="E:\solr-tomcat\solr\data\core0" /> </core> <core name="core1" instanceDir="core1"> <property name="dataDir" value="E:\solr-tomcat\solr\data\core1" /> </core> </cores> <shardHandlerFactory name="shardHandlerFactory" class="HttpShardHandlerFactory"> <str name="urlScheme">${urlScheme:}</str> </shardHandlerFactory> </solr>我们对比下当只有默认的一个core时的文件:
<solr> <solrcloud> <str name="host">${host:}</str> <int name="hostPort">${jetty.port:8983}</int> <str name="hostContext">${hostContext:solr}</str> <int name="zkClientTimeout">${zkClientTimeout:30000}</int> <bool name="genericCoreNodeNames">${genericCoreNodeNames:true}</bool> </solrcloud> <shardHandlerFactory name="shardHandlerFactory" class="HttpShardHandlerFactory"> <int name="socketTimeout">${socketTimeout:0}</int> <int name="connTimeout">${connTimeout:0}</int> </shardHandlerFactory> </solr>原始的solr.xml文件并没有对core的单独配置(因为都是默认的路劲)。而多core的配置文件则需要对core进行基本配置,主要包含“name”(core的名字)、“instanceDir”(在主目录下的相对路径)、“confDir”(配置文件的目录路径,即conf目录,默认是core下的conf目录)、“dataDir”(数据文件的目录路径,即data目录,默认是core下的data目录)等。
一些关键的配置值是:
A)、Persistent="false"指明运行时的任何修改我们不做保存。如拷贝。如果你想保存从启动起的一些改动,那就把 persistent设置为true。如果你的index策略是完成建index到一个纯净的core中然后交换到活动core 那么你绝对应该设为true。
B)、sharedLib="lib"指明了所有core的jar文件的lib目录。如果你有一个core有自己需要的jar文件,那么你可以把他们置入到core/lib目录。例如:karaoke core 使用 Solr Cell来索引化富文本内容,因此那些用来解析和抽取富文本的jar文件被放到./examples/cores/karaoke/lib/.
2.3、运行
如果上面的配置都正常的话,基本的配置都ok了!那我们重启tomcat,打开admin界面。
从“Core Selection”上可以看到我们已经配置好的三个core。而对他们的操作在《solr(二)---基本使用》已经介绍过了。如果不太清楚的,可以去看看笔者的这篇博文。
多个core的配置已经好了,我们就可以根据不同的需求、对不同的core进行不同的配置、实现不同目的的搜索了!
相关文章推荐
- solr配置多个core
- 项目记录:solr4.2 在tomcat7 的两种(singlecore + multicore) 配置安装 及solrj 的初步使用
- solr在Linux上配置多个core
- Solr 配置文件之core.properties、solr.xml和Config Sets
- solr搜索引擎框架搭建,建立多核(多core),与数据库连接,案例分析及动态配置数据库
- Solr 配置文件之core.properties、solr.xml和Config Sets
- solr5.5.0安装配置③☞mysql数据库导入solr的core(windows)
- solr5.4 core配置
- solr5.5的搭建,以及第一个core的配置
- Solr的学习使用之(四)建数据库(添加Core)、表(配置schema.xml)
- solr.Net课程二 solr5.5之core配置
- solr5.5.0安装配置③☞mysql数据库导入solr的core(linux)
- 配置solr的数据库引擎的core时的异常
- solr5.5.0的安装配置②☞solr创建core(linux)
- 关于在Solr Admin页面发现旧的Solr Core配置信息错误的解决办法
- solr配置文件之core.properties
- Solr6.3 Getting Started core.properties的配置信息
- solr5.5.0安装配置②☞solr创建core(windows)
- solr_1.3_安装配置