您的位置:首页 > 其它

【solr 基础篇二】中文分析器的配置

2016-07-25 17:18 267 查看

1、什么是分析器?

英文(Analyzer),一个分析器可以检查字段的文本信息,并且产生一个token流。分析器是schema.xml中的元素的一个子元素,schema.xml可以在solr/conf目录下找到或者跟solrconfig.xml在同一目录。

通常使用下,只有solr.TextField类型的字段会专门制定一个分析器。最简单配置的一个分析器的方式是使用元素,制定这个元素的class属性为一个完整的java类名。具体过程如下:

2、具体配置

1)使用IK-Analyzer,把分析器的文件夹上传到服务器

2)把文件夹中的jar包添加到solr工程中

[root@localhost ~/IK Analyzer 2012FF_hf1]#cp IKAnalyzer2012FF_u1.jar /usr/local/solr/tomcat/webapps/solr/WEB-INF/lib/

3)把IK-Analyzer需要的扩展词典及停用词词典,配置文件复制到colr工程的classpath

[root@localhost ~/IK Analyzer 2012FF_hf1]#cp IKAnalyzer.cfg.xml ext_stopword.dic mydict.dic /usr/local/solr/tomcat/webapps/solr/WEB-INF/classes/

:扩展词典及停用词词典集必须是UTF-8

4)配置fieldType.需要在/usr/local/solr/solrhome/collection1/conf/schema.xml中配置



分析器配置完工之后,我们可以根据业务场景对业务字段进行配置

3、业务字段的配置

判断标准:

- 在搜索时是否需要在此字段上进行搜索 eg:姓名,描述等字段

- 后续的业务是否需要用到此字段 eg:商品Id

依旧是在schema.xml中进行配置:



最后字段添加完之后的效果图:

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: