solr学习文档之添加分词词库
2015-08-05 10:12
267 查看
在上一篇文章中我们学习了solr的快速入门和针对mysql数据库建立索引,今天我们介绍如何为solr添加中文分词
1、 在百度搜索ik-analyzer,找到后下载,我下载的是【IKAnalyzer 2012FF_hf1.zip】,解压后会看到如下目录
![](http://static.huafans.cn/data/attachment/forum/201507/31/164515efsnt8zy0tz0dw0h.png)
2、 把IKAnalyzer2012FF_u1.jar拷贝到webapps下solr的lib文件夹下,把IKAnalyzer.cfg.xml和stopword.dic拷贝到solr的conf目录中
3、 修改schema.xml文件,增加如下内容:
4、 重启tomcat,在collection1中找到analysis,
![](http://static.huafans.cn/data/attachment/forum/201507/31/164355i6cemeeepe6mpp4i.png)
选择text_ik并输入汉字“你好”,将会看到
![](http://static.huafans.cn/data/attachment/forum/201507/31/164504gfkf6dqjtd3j3vfd.png)
则表示成功,你也可以按照ik所给的pdf文档进行操作
所谓分词,就是把你的话给拆开,比如,“我是一个好人”,不同的分词粒度拆分的细度不一样,有的拆成“我,我是,一,一个,好,好人,人”,有的拆成“我是,一个,好人”这主要取决于你的分析粒度
1、 在百度搜索ik-analyzer,找到后下载,我下载的是【IKAnalyzer 2012FF_hf1.zip】,解压后会看到如下目录
![](http://static.huafans.cn/data/attachment/forum/201507/31/164515efsnt8zy0tz0dw0h.png)
2、 把IKAnalyzer2012FF_u1.jar拷贝到webapps下solr的lib文件夹下,把IKAnalyzer.cfg.xml和stopword.dic拷贝到solr的conf目录中
3、 修改schema.xml文件,增加如下内容:
<fieldTypename="text_ik" class="solr.TextField"> <analyzerclass="org.wltea.analyzer.lucene.IKAnalyzer"/> </fieldType>
4、 重启tomcat,在collection1中找到analysis,
![](http://static.huafans.cn/data/attachment/forum/201507/31/164355i6cemeeepe6mpp4i.png)
选择text_ik并输入汉字“你好”,将会看到
![](http://static.huafans.cn/data/attachment/forum/201507/31/164504gfkf6dqjtd3j3vfd.png)
则表示成功,你也可以按照ik所给的pdf文档进行操作
所谓分词,就是把你的话给拆开,比如,“我是一个好人”,不同的分词粒度拆分的细度不一样,有的拆成“我,我是,一,一个,好,好人,人”,有的拆成“我是,一个,好人”这主要取决于你的分析粒度
相关文章推荐
- 让水平LinearLayout中的两个子元素分别居左和居右
- cin等输入用法
- Android---62---DrawerLayout实现抽屉效果
- 考勤数据修改影响
- style、currentStyle、getComputedStyle区别介绍
- 使用七牛云存储在网站中进行图片外链
- dSploitzANTI渗透教程之HTTP服务重定向地址
- rsync服务搭建
- 关于安卓4.0以上菜单图标不生效的问题
- 南邮 OJ 1154 message
- 利用3.3V供电RS485接口实现远距离数据通信
- asp.net常见问题收集二
- CCS调试CSL_intc GlobalEnable,first referenced in ./xxx.obj解决方案
- ubuntu14.04server开机出现“General error mounting file systems”问题
- mysql数据库单表只有一个主键自增id字段,ibatis实现id自增
- unity3d爬坑手记——prefab篇
- Binary Tree Postorder Traversal
- coffeescript使用的方式汇总
- 积累linux常用命令大全
- Java高级面试题