您的位置:首页 > 其它

Elasticsearch替换中文分词

2016-06-17 15:44 218 查看
Elasticsearch的中文分词很烂,所以用ik替换。首先从github上下载项目,地址是:https://github.com/medcl/elasticsearch-analysis-ik

(1)使用unzip解压

unzip elasticsearch-analysis-ik-master.zip


如果提示找不到unzip,使用yum安装就行了。

(2)编译jar包

使用maven打包,如果没安装的话用yum安装

yum install maven


打包的命令:

cd elasticsearch-analysis-ik-master
mvn package


等待打包过程,期间还要从网上下载依赖,waiting…

(3)配置

copy and unzip target/releases/elasticsearch-analysis-ik-{version}.zip to your-es-root/plugins/ik

ik_max_word: 会将文本做最细粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌”,会穷尽各种可能的组合;

ik_smart: 会做最粗粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,国歌”。

重启
service elasticsearch restart
,搞定。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  elasticsearch