solr搜索智能提示Suggest
2015-11-06 15:44
316 查看
solr1.4以后实现的智能提示,方便用户输入搜索
Suggest配置
Xml代码
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/31/13fab62c587e8ed2ab2b15ae23bd471d.png)
<searchComponent name="suggest" class="solr.SpellCheckComponent">
<str name="queryAnalyzerFieldType">string</str>
<lst name="spellchecker">
<str name="name">suggest</str>
<str name="classname">org.apache.solr.spelling.suggest.Suggester</str>
<str name="lookupImpl">org.apache.solr.spelling.suggest.tst.TSTLookup</str>
<str name="field">name</str>
<float name="threshold">0.0001</float>
<!--<str name="sourceLocation">suggest_dict.txt</str>-->
<!--<str name="spellcheckIndexDir">spellchecker</str>-->
<str name="comparatorClass">freq</str>
<str name="buildOnOptimize">true</str>
<str name="buildOnCommit">true</str>
</lst>
</searchComponent>
<requestHandler name="/suggest" class="org.apache.solr.handler.component.SearchHandler">
<lst name="defaults">
<str name="spellcheck">true</str>
<str name="spellcheck.dictionary">suggest</str>
<str name="spellcheck.count">8</str>
<str name="spellcheck.onlyMorePopular">true</str>
<str name="spellcheck.extendedResults">false</str>
<str name="spellcheck.collate">true</str>
<!--<str name="spellcheck.build">true</str> -->
</lst>
<arr name="components">
<str>suggest</str>
</arr>
</requestHandler>
说明:
1.solr的suggest基于solr.SpellCheckComponent
2.queryAnalyzerFieldType 参数为string,在这不要定义复杂分词,如果是根据某一个索引字段,意义不大
3.field字段名,表示基于schema中的某一个索引字段
4.threshold限制一些不常用的词出现,值越大过滤纸越多
5.sourceLocation用于设置字典,如果有一个字典能记录用户常搜索的字,那提示更更好
6.spellcheckIndexDir如果已经设置spellcheck,那么可以在此制定目录
7.字典格式如下
# This is a sample dictionary file.
acquire
accidentally\t2.0
accommodate\t3.0
文本格式utf-8,#开头表示注释,被忽略
每一个词一行,后面带权重
8.配置词典后在requestHandler中设置spellcheck.onlyMorePopular为true,可以根据权重排序
9.spellcheck.count返回行
配置完成重启服务后,设置参数suggest/?spellcheck.build=true来创建spellchecker的索引
然后输入:http://ip:port/corename/suggest?q=xxx进行搜索了
接下来就是前台js实现的问题了。
当然也可以通过solrj来进行搜索
Java代码
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/31/13fab62c587e8ed2ab2b15ae23bd471d.png)
CommonsHttpSolrServer server = new CommonsHttpSolrServer(
"http://ip:port/corename/");
SolrQuery params = new SolrQuery();
String token = "牛";
params.set("qt", "/suggest");
params.set("q", token);
params.set("spellcheck.build", "true");
QueryResponse response = null;
try {
response = server.query(params);
System.out.println("查询耗时:" + response.getQTime());
} catch (SolrServerException e) {
System.err.println(e.getMessage());
e.printStackTrace();
} catch (Exception e) {
System.err.println(e.getMessage());
e.printStackTrace();
} finally {
}
SpellCheckResponse spellCheckResponse = response
.getSpellCheckResponse();
if (spellCheckResponse != null) {
List<Suggestion> suggestionList = spellCheckResponse
.getSuggestions();
for (Suggestion suggestion : suggestionList) {
System.out.println("Suggestions NumFound: "
+ suggestion.getNumFound());
System.out.println("Token: " + suggestion.getToken());
System.out.print("Suggested: ");
List<String> suggestedWordList = suggestion.getAlternatives();
for (String word : suggestedWordList) {
System.out.println(word + ", ");
}
System.out.println();
}
}
这样就可以。
对于Suggest,个人的想法,字典是一种好的方式,但是增加字典比较麻烦,还有可以独立一个字段,对该字段做一些特殊的分词,比如像商品搜索类,整个标题可以是一个词,中文,数字,英文,符号等间隔的分开,这个具体还是看应用了。
现在我在诚交网易货商品搜索上用的是字段的方式,新建一个单独的排序字段,然后把需要提示的字段拷贝过来,效果还算可以,大家看下图或去诚交网体验一下。
Suggest配置
Xml代码
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/31/13fab62c587e8ed2ab2b15ae23bd471d.png)
<searchComponent name="suggest" class="solr.SpellCheckComponent">
<str name="queryAnalyzerFieldType">string</str>
<lst name="spellchecker">
<str name="name">suggest</str>
<str name="classname">org.apache.solr.spelling.suggest.Suggester</str>
<str name="lookupImpl">org.apache.solr.spelling.suggest.tst.TSTLookup</str>
<str name="field">name</str>
<float name="threshold">0.0001</float>
<!--<str name="sourceLocation">suggest_dict.txt</str>-->
<!--<str name="spellcheckIndexDir">spellchecker</str>-->
<str name="comparatorClass">freq</str>
<str name="buildOnOptimize">true</str>
<str name="buildOnCommit">true</str>
</lst>
</searchComponent>
<requestHandler name="/suggest" class="org.apache.solr.handler.component.SearchHandler">
<lst name="defaults">
<str name="spellcheck">true</str>
<str name="spellcheck.dictionary">suggest</str>
<str name="spellcheck.count">8</str>
<str name="spellcheck.onlyMorePopular">true</str>
<str name="spellcheck.extendedResults">false</str>
<str name="spellcheck.collate">true</str>
<!--<str name="spellcheck.build">true</str> -->
</lst>
<arr name="components">
<str>suggest</str>
</arr>
</requestHandler>
说明:
1.solr的suggest基于solr.SpellCheckComponent
2.queryAnalyzerFieldType 参数为string,在这不要定义复杂分词,如果是根据某一个索引字段,意义不大
3.field字段名,表示基于schema中的某一个索引字段
4.threshold限制一些不常用的词出现,值越大过滤纸越多
5.sourceLocation用于设置字典,如果有一个字典能记录用户常搜索的字,那提示更更好
6.spellcheckIndexDir如果已经设置spellcheck,那么可以在此制定目录
7.字典格式如下
# This is a sample dictionary file.
acquire
accidentally\t2.0
accommodate\t3.0
文本格式utf-8,#开头表示注释,被忽略
每一个词一行,后面带权重
8.配置词典后在requestHandler中设置spellcheck.onlyMorePopular为true,可以根据权重排序
9.spellcheck.count返回行
配置完成重启服务后,设置参数suggest/?spellcheck.build=true来创建spellchecker的索引
然后输入:http://ip:port/corename/suggest?q=xxx进行搜索了
接下来就是前台js实现的问题了。
当然也可以通过solrj来进行搜索
Java代码
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/31/13fab62c587e8ed2ab2b15ae23bd471d.png)
CommonsHttpSolrServer server = new CommonsHttpSolrServer(
"http://ip:port/corename/");
SolrQuery params = new SolrQuery();
String token = "牛";
params.set("qt", "/suggest");
params.set("q", token);
params.set("spellcheck.build", "true");
QueryResponse response = null;
try {
response = server.query(params);
System.out.println("查询耗时:" + response.getQTime());
} catch (SolrServerException e) {
System.err.println(e.getMessage());
e.printStackTrace();
} catch (Exception e) {
System.err.println(e.getMessage());
e.printStackTrace();
} finally {
}
SpellCheckResponse spellCheckResponse = response
.getSpellCheckResponse();
if (spellCheckResponse != null) {
List<Suggestion> suggestionList = spellCheckResponse
.getSuggestions();
for (Suggestion suggestion : suggestionList) {
System.out.println("Suggestions NumFound: "
+ suggestion.getNumFound());
System.out.println("Token: " + suggestion.getToken());
System.out.print("Suggested: ");
List<String> suggestedWordList = suggestion.getAlternatives();
for (String word : suggestedWordList) {
System.out.println(word + ", ");
}
System.out.println();
}
}
这样就可以。
对于Suggest,个人的想法,字典是一种好的方式,但是增加字典比较麻烦,还有可以独立一个字段,对该字段做一些特殊的分词,比如像商品搜索类,整个标题可以是一个词,中文,数字,英文,符号等间隔的分开,这个具体还是看应用了。
现在我在诚交网易货商品搜索上用的是字段的方式,新建一个单独的排序字段,然后把需要提示的字段拷贝过来,效果还算可以,大家看下图或去诚交网体验一下。
![](https://oscdn.geek-share.com/Uploads/Images/Content/201909/20/b4da86b7fda498f96042eb24983862dc.png)
相关文章推荐
- 设计模式分类
- libevent代码阅读(6)——“hello-world.c”之 io复用机制
- hdu5506GT and set(暴搜)
- 谁说C++语言超级难学?师兄教你四招搞定C++
- CentOS 编译安装 mysql
- extjs,ComboReturn
- 用到boost时间,编译报错
- sprintf详解
- 内存的申请与释放
- 科研是有方向的
- js获取关于浏览器上的信息
- 计算机专业该不该读研
- 基于JavaScript实现仿京东图片轮播效果
- 搬迁学习笔记2——The specified child already has a parent的解决方法
- 推荐系统相关
- DATATABLE的操作
- Lightoj 1231 - Coin Change (I) (裸裸的多重背包)
- Java 7 Fork/Join 并行计算框架概览
- Java语言基础之String类
- AndroidStudio插件-GsonFormat快速实现JavaBean