Solr配置中文分词器IK Analyzer详解
2015-12-03 15:20
344 查看
配置的过程中出现了一些小问题,一下将详细讲下IK Analyzer的配置过程,配置非常的简单,但是首先主要你的Solr版本是哪个,如果是3.x版本的用IKAnalyzer2012_u6.zip如果是4.x版本的用IK Analyzer 2012FF_hf1.zip,一定要对应上,要不然会配置失败。以下是详细步骤:
但是由于本国国情,需要翻墙才能下载,以下是本人亲自上传的资源,可以到以下页面下载4.x或者3.x:
solr4.x:http://download.csdn.net/download/tjcyjd/8420639
solr3.x:http://download.csdn.net/download/tjcyjd/8420523
[html]
view plaincopy
![](https://oscdn.geek-share.com/Uploads/Images/Content/201611/a7c8e286f463007e2a900848b93dd72c.png)
![](https://oscdn.geek-share.com/Uploads/Images/Content/201611/9e12f1d3e499fc949c886e7c9e0484f9)
<fieldType name="text_ik" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
最后就可以使用text_ik了
[html]
view plaincopy
![](https://oscdn.geek-share.com/Uploads/Images/Content/201611/a7c8e286f463007e2a900848b93dd72c.png)
![](https://oscdn.geek-share.com/Uploads/Images/Content/201611/9e12f1d3e499fc949c886e7c9e0484f9)
<field name="my_name" type="text_ik" indexed="true" stored="true" multiValued="false" />
1、下载IK Analyzer。
下载地址为:http://code.google.com/p/ik-analyzer/downloads/list但是由于本国国情,需要翻墙才能下载,以下是本人亲自上传的资源,可以到以下页面下载4.x或者3.x:
solr4.x:http://download.csdn.net/download/tjcyjd/8420639
solr3.x:http://download.csdn.net/download/tjcyjd/8420523
2、拷贝配置文件。
解压压缩包将IKAnalyzer.cfg.xml、stopword.dic拷贝至需要使用分词器的core的conf下面,和core的schema.xml文件一个目录。3、修改schema.xml配置文件。
与其它分词器的配置大体相同,在<types></types>配置项间加一段如下配置:[html]
view plaincopy
![](https://oscdn.geek-share.com/Uploads/Images/Content/201611/a7c8e286f463007e2a900848b93dd72c.png)
<fieldType name="text_ik" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
最后就可以使用text_ik了
[html]
view plaincopy
![](https://oscdn.geek-share.com/Uploads/Images/Content/201611/a7c8e286f463007e2a900848b93dd72c.png)
<field name="my_name" type="text_ik" indexed="true" stored="true" multiValued="false" />
4、测试。
输入:http://localhost:8080/solr,分词效果如下相关文章推荐
- 程序人生
- MVC EasyUI 时间格式化
- 仿京东树形菜单插件hovertree
- jsonp 实例
- 判断一元二次方程实根情况
- IMPDP hangs, session wait “wait for unread message on broadcast channel”
- 二分查找算法
- 在eclipse中执行数据库脚本
- JSON详解
- poi导入xls表格老版本问题解决,写入文件,删除文件操作
- dllexport和dllimport的区别
- java泛型中? super T和? extends T的区别
- Android——蓝牙连接打印机
- MySQL命令大全
- 搞搞阿里云 及 centos7.0 成功安装docker
- Linux用户管理
- 【Android工具】手机屏幕录制并转换成GIF
- 哥德巴赫猜想 POJ2909
- UIView动画
- Tomcat 部署项目报错文件被锁 If a file is locked .