您的位置:首页 > 其它

elasticsearch-analysis-ik 分词插件安装及配置

2016-06-15 17:22 501 查看
官方github主页给出了详细的安装过程、配置方法、热更新IK分词、常见问题。本篇作为其实践过程。

测试使用elasticsearch-analysis-ik-1.9.1版本。

安装 elasticsearch-analysis-ik

git clone https://github.com/medcl/elasticsearch-analysis-ik cd elasticsearch-analysis-ik
mvn clean
mvn complie
mvn package  # 该操作会在当前目录生成elasticsearch-analysis-ik-*.zip


拷贝生成的elasticsearch-analysis-ik-.zip至elasticsearch的plugins/ik目录(无该目录则自己新建),解压elasticsearch-.zip。此时plugins/ik目录如下图所示:



至此,Elasticsearch的ik分词器已安装成功。重启Elasticsearch服务使ik分词器生效,在启动日志中看到如下信息则说明ik分词器安装成功:



注:

一些教程将图中的ik目录(图中红色矩形标注的部分)拷贝到Elasticsearch的config目录下,但在本次实践中,拷贝ik目录(图中红色矩形标注的部分)会导致Elasticsearch重启失败,而且elasticsearch-analysis-ik的github教程中亦没有拷贝ik目录(字典目录)的操作。

一些教程在安装完elasticsearch-analysis-ik,会去修改Elasticsearch在config目录下的配置文件elasticsearch.yml —— 通过在配置文件后新加一行“ index.analysis.analyzer.ik.type : “ik” ” 来配置Elasticsearch的默认分词器为ik。

配置词典

由于公司文搜的词典存储在MySQL数据库中,所以首先使用Sqlyog导出字典对应的table,导出的文件格式为cvs,通过excel打开cvs文件,提取出所有的词,并将其存储为UTF-8格式的文件tts_word.dic。将tts_word.dic文件放在ik目录(图中红色矩形标注的部分)的coustom子目录下,重启Elasticsearch服务载入tts_word.dic中的词典,载入成功则在启动日志中可以看到如下信息:

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: