您的位置：首页 > 其它

solr添加IKAnalyzer分词器

2016-04-21 18:56 453 查看

最近在学习solr时候，碰到一个问题，就是如果采用默认的分词器，会将每个字都分割成一个词组进行索引

比如：长沙市会被分词为   “长”，“沙”，“市”，这样就达不到我想要的效果

    例如：

         <field name="name" type="text_general" indexed="true" stored="true"/>
   这个是默认的分词器

     <fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />

<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>    我对城市名称进行索引
    结果：

      对每个字都进行了分词

所以这里我们需要手动加入分词功能，我这里采用的IKAnalyzer，这里分词，会进行词组分词    “长沙”，“市” 这样

      在schema.xml文件中加入    <fieldType name="text_ik" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

<field name="name" type="text_ik" indexed="true" stored="true"/>

然后重启

这样效果就达到了，这里和lucene的差不多滴！

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： solr

相关文章推荐

新的分享

章节导航