Solr之fieldtype
2016-05-16 20:33
344 查看
在 schema.xml 中设置
fieldtype 这个标签来对字段类型进行一系列的控制,例如,分词器的选择,停用词(所有的停用词是放到了一个txt文件中),词干提取算法(例如使用 Porter Stemming 算法进行词干提取
标签结构说明(对text字段举例说明,这里对index索引和query查询建立了两个analyzer):
这里的 tokenizer 用来生成token,就是要检索的词
fieldtype 这个标签来对字段类型进行一系列的控制,例如,分词器的选择,停用词(所有的停用词是放到了一个txt文件中),词干提取算法(例如使用 Porter Stemming 算法进行词干提取
(EnglishPorterFilterFactory))
标签结构说明(对text字段举例说明,这里对index索引和query查询建立了两个analyzer):
<fieldtype name="text" class="solr.TextField"> <analyzer type="index"> <tokenfilter class="......"/> <tokenizer class="solr.WhitespaceTokenizerFactory"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/> <filter class="solr.WordDelimiterFilterFactory" /> <filter class="solr.LowerCaseFilterFactory"/> <filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt"/> <filter class="solr.RemoveDuplicatesTokenFilterFactory"/> </analyzer> <analyzer type="query"> <tokenizer class="solr.WhitespaceTokenizerFactory"/> <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/> <filter class="solr.WordDelimiterFilterFactory"/> <filter class="solr.LowerCaseFilterFactory"/> <filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt"/> <filter class="solr.RemoveDuplicatesTokenFilterFactory"/> </analyzer> </fieldtype>
这里的 tokenizer 用来生成token,就是要检索的词
相关文章推荐
- 查验身份证(水)
- poj2431 优先队列
- Android面试题集合
- Protobuf的自动打包
- 网络攻防平台第七关
- Java出现No enclosing instance of type E is accessible
- 最长对称子串(KMP)
- events.js:72 throw er; // Unhandled 'error' event
- mysql etl过程 p_social_scan
- 【GDOI 2016 Day1】第二题 最长公共子串
- Ajax通用代码封装
- 利用a标签自动解析URL
- bzoj3531 [Sdoi2014]旅行 树链剖分+动态开线段树
- 计算机组成原理---为什么计算机中要使用补码?
- PAT 朋友圈(并查集)
- 萌妹子图一张
- 4-1 迷宫
- 萌妹子图一张
- linux 入门教程
- 图书信息管理系统编程学习与体会