您的位置:首页 > 其它

solr的分词器

2016-06-21 00:00 351 查看
摘要: solr的分词器

[code=language-java]1.将IKAnalyzer2012FF_u1.jar包拷贝到 /usr/local/devTools/solr/apache-tomcat-7.0.47/webapps/solr/WEB-INF/lib文件夹下面

2.将IKAnalyzer.cfg.xml,ext_stopword.dic,mydict.dic拷贝到/usr/local/devTools/solr/apache-tomcat-7.0.47/webapps/solr/WEB-INF/classes,classpath下面
注意扩展词典,和停用词词典必须是UTF-8

3.配置filedType,在solrhome/collection1/conf/schema.xml末尾中配置如下信息
<fieldType name="text_ik" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

4.配置业务字段,
业务字段判断标准,
1.该字段是否在搜索时是否需要在字段上收索,
2.后续操作是否需要用到该字段

用到的字段
商品id,商品title,商品买点,价格,商品img,商品分类名称,商品描述
1.id===>商品id
... ...
在solrhome/collection1/conf/schema.xml文件末尾配置如下

<field name="item_title" type="text_ik" indexed="true" stored="true"/>
<field name="item_sell_point" type="text_ik" indexed="true" stored="true"/>
<field name="item_price"  type="long" indexed="true" stored="true"/>
<field name="item_image" type="string" indexed="false" stored="true" />
<field name="item_category_name" type="string" indexed="true" stored="true" />
<field name="item_desc" type="text_ik" indexed="true" stored="false" />

<field name="item_keywords" type="text_ik" indexed="true" stored="false" multiValued="true"/>
<copyField source="item_title" dest="item_keywords"/>
<copyField source="item_sell_point" dest="item_keywords"/>
<copyField source="item_category_name" dest="item_keywords"/>
<copyField source="item_desc" dest="item_keywords"/>

item_keywords:搜索域

5.从新启动tomcat


配置:



浏览器页面

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: