您的位置:首页 > 其它

solr分词只能全词匹配怪现象

2015-07-22 17:05 295 查看
现象:

例如ik分词,安装配置后,可以正常分词,如下图所示Index和Query都没问题了,十分高兴吧!





随后,创建collection,导入数据,再尝试搜索。如下图所示,我们搜索“第四次会议”,可以看到有3条记录,还有点小兴奋!






既然已经分词了,应该可以搜索非完全匹配的,如下图所示:






fuck!Why 搜索“第五次会议”一条匹配的没有?关键搜索条件也进行了分词!郁闷的一天开始了,索引删了建建了删,反反复复尝试,向大牛益达反复咨询。最后我开始怀疑了,是不是lucene底层就是这样的?启动我的ElasticSearch服务,确认了一下,120%可以部分匹配搜索。

        百度点的搜都有麻木的时候发下如下这两篇文章:

http://www.aboutit.cn/post/323


http://blog.csdn.net/bruce128/article/details/18351593



特别注意,我用的是solr4.9,所以需要把各核心schema.xml中的版本由1.1改为1.5这样查询时分词才能成功,比如搜索中华人民共和国,如果不配置的话,默认是短语匹配,就只搜索文档中包含中华人民共和国的结果,但是如果配置了查询分词,那么中华、人民….都能被匹配。

修改后的schema如下所示:
<span style="color:#330033;"><strong><schema name="example core zero" version="1.5"></strong></span>
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  solr IK