ElasticSearch中文分词IK安装
2016-05-06 13:22
417 查看
elasticsearch-analysis-ik是一款中文的分词插件,支持自定义词库。
安装步骤:
1、到github网站下载源代码,网站地址为:https://github.com/medcl/elasticsearch-analysis-ik
右侧下方有一个按钮“Download ZIP",点击下载源代码elasticsearch-analysis-ik-master.zip。
2、解压文件elasticsearch-analysis-ik-master.zip,进入下载目录,执行命令: unzip elasticsearch-analysis-ik-master.zip
3、将解压目录文件中config/ik文件夹复制到ES安装目录config文件夹下。
4、因为是源代码,此处需要使用maven打包,进入解压文件夹中,执行命令:mvn clean package
{
如果提示没有mvn命令
Mvn安装:
sudo wget http://repos.fedorapeople.org/repos/dchen/apache-maven/epel-apache-maven.repo-O /etc/yum.repos.d/epel-apache-maven.repo
(如果wget没安装,执行sudo yum -y install wget)
sudo yum -y install apache-maven
}
5、copy and unzip
6、在ES的配置文件config/elasticsearch.yml中增加ik的配置,在最后增加:
index:
analysis:
analyzer:
ik:
alias: [ik_analyzer]
type: org.elasticsearch.index.analysis.IkAnalyzerProvider
ik_max_word:
type: ik
use_smart: false
ik_smart:
type: ik
use_smart: true
或
index.analysis.analyzer.ik.type : “ik”
7、重新启动elasticsearch服务,这样就完成配置了,收入命令:
curl -XPOST "http://localhost:9200/userinfo/_analyze?analyzer=ik&pretty=true&text=我是中国人"
测试结果如下:
说明:
1、ES安装插件本来使用使用命令plugin来完成,但是我本机安装ik时一直不成功,所以就使用源代码打包安装了。
2、自定义词库的方式,请参考 https://github.com/medcl/elasticsearch-analysis-ik
安装步骤:
1、到github网站下载源代码,网站地址为:https://github.com/medcl/elasticsearch-analysis-ik
右侧下方有一个按钮“Download ZIP",点击下载源代码elasticsearch-analysis-ik-master.zip。
2、解压文件elasticsearch-analysis-ik-master.zip,进入下载目录,执行命令: unzip elasticsearch-analysis-ik-master.zip
3、将解压目录文件中config/ik文件夹复制到ES安装目录config文件夹下。
4、因为是源代码,此处需要使用maven打包,进入解压文件夹中,执行命令:mvn clean package
{
如果提示没有mvn命令
Mvn安装:
sudo wget http://repos.fedorapeople.org/repos/dchen/apache-maven/epel-apache-maven.repo-O /etc/yum.repos.d/epel-apache-maven.repo
(如果wget没安装,执行sudo yum -y install wget)
sudo yum -y install apache-maven
}
5、copy and unzip
target/releases/elasticsearch-analysis-ik-{version}.zipto
your-es-root/plugins/ik
6、在ES的配置文件config/elasticsearch.yml中增加ik的配置,在最后增加:
index:
analysis:
analyzer:
ik:
alias: [ik_analyzer]
type: org.elasticsearch.index.analysis.IkAnalyzerProvider
ik_max_word:
type: ik
use_smart: false
ik_smart:
type: ik
use_smart: true
或
index.analysis.analyzer.ik.type : “ik”
7、重新启动elasticsearch服务,这样就完成配置了,收入命令:
curl -XPOST "http://localhost:9200/userinfo/_analyze?analyzer=ik&pretty=true&text=我是中国人"
测试结果如下:
{ tokens: [ { token: text start_offset: 2 end_offset: 6 type: ENGLISH position: 1 } { token: 我 start_offset: 9 end_offset: 10 type: CN_CHAR position: 2 } { token: 中国人 start_offset: 11 end_offset: 14 type: CN_WORD position: 3 } { token: 中国 start_offset: 11 end_offset: 13 type: CN_WORD position: 4 } { token: 国人 start_offset: 12 end_offset: 14 type: CN_WORD position: 5 } ] }
说明:
1、ES安装插件本来使用使用命令plugin来完成,但是我本机安装ik时一直不成功,所以就使用源代码打包安装了。
2、自定义词库的方式,请参考 https://github.com/medcl/elasticsearch-analysis-ik
相关文章推荐
- Tomcat出现access denied错误解决方案
- 设计模式之装饰模式
- 关于init、action、end
- 156 - Ananagrams
- Android EventBus源码解析 带你深入理解EventBus
- Domino domcfg中表单的reasonType值
- Root Motion深度解析[Unity]
- 字符串算法之最长公共子序列
- HDU 1053 - Entropy
- 九度OJ--Q1166
- Yii 将对象转化成数组
- Android EventBus实战 没听过你就out了
- Say Hello to CSDN
- INFO org.apache.hadoop.ipc.RPC: Server at master/192.168.200.128:9000 not available yet, Zzzzz...
- KMP算法入门
- 分布式设计与开发(三)------高一致性服务ZooKeeper
- 【转】gc日志分析工具
- iOS开发系列-动画绘图CALayer
- 简单三层网络配置
- 圆