【solr】——配置中文分析器
2017-02-20 09:39
155 查看
开篇
本篇博客简单的学习一下solr的使用,使用单机版。Solr安装成功后并且启动后可以通过ip:port /solr/进行访问。Document即文档是solr用来搜索的数据源,这些数据源是我们上传到solr的。不同的应用程序数据库可以通过配置schema.xml来添加要导入到solr中的字段。
正文
第一部分:中文分词器
正式开始介绍如何使用之前先配置一下中文分析器,要使用的分析器是IKAnalyzer,它是一款结合了词典和文法分析算法的中文分词组件,基于字符串匹配,支持用户词典扩展定义,支持细粒度和智能切分,先看如何配置然后看实际效果。第一步:把IKAnalyzer依赖的jar包添加到solr工程中。
第二步:把分析器使用的扩展词典添加到classpath中。
第三步:在Schema.xml中需要自定义一个FieldType,可以在FieldType中指定中文分析器。Schema.xml路径入下:
该配置文件末尾添加如下配置:
<fieldType name="text_ik" class="solr.TextField"> <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/> </fieldType>
启动tomcat,通过浏览器访问solr,输入内容测试中文分词器,效果图如下:
第二部分:数据导入简介
在使用之前首先要向solr中导入测试的数据文件。有很多种方式将数据导入到Solr中:1、通过Data Import Handler(DIH)从数据库中导入数据
2、加载CSV文件(文件中的数据用逗号分隔),csv文件可以是Excel和Mysql导出的。
3、Post json文档
4、通过Solr Cell索引二进制文档,如word或者pdf。
5、通过java或者solr支持的其他语言,用程序创建并导入到solr中。
小结
本篇配置好了solr的中文分词器,下篇博客结合程序使用solrj向solr中导入数据。相关文章推荐
- [置顶] 服务器(3)--搭建单机版Solr服务器+配置中文分析器
- 【Solr7】——配置中文分析器
- solr 配置中文分析器/定义业务域/配置DataImport功能方法(测试用)
- solr配置中文分析器及业务字段
- Solr配置文件介绍、中文分析器以及数据导入
- solr--4.配置中文分析器
- solr配置中文分析器
- Solr配置中文分析器以及业务字段
- solr学习之域的管理与中文分析器配置
- Centos7系统环境下Solr之Java实战(二)制定中文分析器、配置业务域
- 【solr 基础篇二】中文分析器的配置
- windows 上配置solr5.2.1+solr4.3+中文分词器
- Windows下面安装和配置Solr 4.9(三)支持中文分词器
- Linux(CentOS6.4)Solr4.8.1中文分词配置(IK分词)
- solr 中文分词器IK分词器的配置
- 配置solr4.10.0和中文分词IKAnalyzer
- solr4.7安装配置,solrcloud安装配置,中文分词使用步骤
- solr下配置中文分词mmseg4j
- Solr4.7.1中配置中文分词器
- solr 4.8+mysql数据库数据导入 + mmseg4j中文全文索引 配置笔记