Elasticsearch替换中文分词
2016-06-17 15:44
218 查看
Elasticsearch的中文分词很烂,所以用ik替换。首先从github上下载项目,地址是:https://github.com/medcl/elasticsearch-analysis-ik
如果提示找不到unzip,使用yum安装就行了。
打包的命令:
等待打包过程,期间还要从网上下载依赖,waiting…
ik_max_word: 会将文本做最细粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌”,会穷尽各种可能的组合;
ik_smart: 会做最粗粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,国歌”。
重启
(1)使用unzip解压
unzip elasticsearch-analysis-ik-master.zip
如果提示找不到unzip,使用yum安装就行了。
(2)编译jar包
使用maven打包,如果没安装的话用yum安装yum install maven
打包的命令:
cd elasticsearch-analysis-ik-master mvn package
等待打包过程,期间还要从网上下载依赖,waiting…
(3)配置
copy and unzip target/releases/elasticsearch-analysis-ik-{version}.zip to your-es-root/plugins/ikik_max_word: 会将文本做最细粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌”,会穷尽各种可能的组合;
ik_smart: 会做最粗粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,国歌”。
重启
service elasticsearch restart,搞定。
相关文章推荐
- 巧用mysql提示符prompt清晰管理数据库的方法
- 两大步骤教您开启MySQL 数据库远程登陆帐号的方法
- phpmyadmin 4+ 访问慢的解决方法
- linux系统下实现mysql热备份详细步骤(mysql主从复制)
- CentOS 5.5下安装MySQL 5.5全过程分享
- MySQL复制的概述、安装、故障、技巧、工具(火丁分享)
- MySQL中删除重复数据的简单方法
- 使用ElasticSearch6.0快速实现全文搜索功能的示例代码
- elasticsearch批量数据导入和导出
- 使用ElasticSearch+LogStash+Kibana+Redis搭建日志管理服务
- ElasticSearch 使用心得
- ES中如何使用逗号来分词
- ElasticSearch 守护进程 JSW
- elasticsearch2.3安装以及集群部署
- Elasticsearch2.2.0数据操作
- Elasticsearch2.2.0安装ik中文分词
- Elasticsearch2.2.0安装pinyin插件
- Elasticsearch Client(JAVA API) JAVA实例
- ElasticSearch简单介绍
- ELK(ElasticSearch, Logstash, Kibana)搭建实时日志分析平台