您的位置:首页 > 其它

solr中文分词

2016-07-26 00:00 411 查看
solr6.0使用IK分词。

需要jar包ik-analyzer-solr5-5.x.jar,放置目录每个solr服务下面的server/solr-webapp/webapp/WEB-INF/lib/目录。

IKAnalyzer.cfg.xml文件放置在solrhome/conf/files/目录下,用于扩展中文单词。
文件内容为:
<?xml version="1.0" encoding="UTF-8"?>

<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">

<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典
<entry key="ext_dict">mydict.dic;</entry>
-->
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords">stopword.dic;</entry>
</properties>
3. stopword.dic放置在solrhome/conf/files/目录下。
4. 配置solrhome/conf/files/manage-schema,添加如下内容:
<fieldType name="text_ik" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
<field name="text_ik" type="text_ik" indexed="true" stored="true" multiValued="false" />
<field name="text_ik" type="text_ik" indexed="true" stored="true" multiValued="false" />

全部配置好后重新上传配置文件至zookeeper管理

批量重启solr
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: