solr分词只能全词匹配怪现象
2015-07-22 17:05
295 查看
现象:
例如ik分词,安装配置后,可以正常分词,如下图所示Index和Query都没问题了,十分高兴吧!
随后,创建collection,导入数据,再尝试搜索。如下图所示,我们搜索“第四次会议”,可以看到有3条记录,还有点小兴奋!
既然已经分词了,应该可以搜索非完全匹配的,如下图所示:
fuck!Why 搜索“第五次会议”一条匹配的没有?关键搜索条件也进行了分词!郁闷的一天开始了,索引删了建建了删,反反复复尝试,向大牛益达反复咨询。最后我开始怀疑了,是不是lucene底层就是这样的?启动我的ElasticSearch服务,确认了一下,120%可以部分匹配搜索。
百度点的搜都有麻木的时候发下如下这两篇文章:
http://www.aboutit.cn/post/323
http://blog.csdn.net/bruce128/article/details/18351593
修改后的schema如下所示:
例如ik分词,安装配置后,可以正常分词,如下图所示Index和Query都没问题了,十分高兴吧!
随后,创建collection,导入数据,再尝试搜索。如下图所示,我们搜索“第四次会议”,可以看到有3条记录,还有点小兴奋!
既然已经分词了,应该可以搜索非完全匹配的,如下图所示:
fuck!Why 搜索“第五次会议”一条匹配的没有?关键搜索条件也进行了分词!郁闷的一天开始了,索引删了建建了删,反反复复尝试,向大牛益达反复咨询。最后我开始怀疑了,是不是lucene底层就是这样的?启动我的ElasticSearch服务,确认了一下,120%可以部分匹配搜索。
百度点的搜都有麻木的时候发下如下这两篇文章:
http://www.aboutit.cn/post/323
http://blog.csdn.net/bruce128/article/details/18351593
特别注意,我用的是solr4.9,所以需要把各核心schema.xml中的版本由1.1改为1.5这样查询时分词才能成功,比如搜索中华人民共和国,如果不配置的话,默认是短语匹配,就只搜索文档中包含中华人民共和国的结果,但是如果配置了查询分词,那么中华、人民….都能被匹配。
修改后的schema如下所示:<span style="color:#330033;"><strong><schema name="example core zero" version="1.5"></strong></span>
相关文章推荐
- 在Eclipse中运行Solr 基础知识
- Solr基础--设置solr/home的三种方式
- Docker使用supervisor构建solr
- solr4.0安装和简单导入mysql数据
- Solr 4.0 基础教程
- 自译Solr in action中文版
- Solr In Action 中文版 第一章(一)
- Solr In Action 中文版 第一章 (二)
- Solr In Action 中文版 第一章(三)
- 基于solr实现hbase的二级索引
- 基于Nutch&Solr定向采集解析和索引搜索的整合技术指南文档
- 基于Nutch&Solr定向采集解析和索引搜索的整合技术指南文档
- Tomcat/Solr4.3.1 配置过程
- Solr Facet技术的应用与研究
- Apache Solr查询语法
- Solr客户端删除数据的方式
- lucene集成IK实现中文分词检索
- Centos 安装 Solr
- solr空间查询
- lucene solr在tomcat中的配置