智能提示(三)facet 聚合属性(类别、标签)提示
2015-10-21 17:50
423 查看
大概需求,solr实现以下类似京东的智能提示功能的方案,带有标签值、或者分类和短语的:
京东:
淘宝:
简单分析上图,在输入关键字部分商品含有特殊属性,分类,标签的时候 就给输入关键字提示 的下一个层级展示该标签。
用过solr的朋友,看到这个 全球购 第一时间会想到facet。
大概思路:
存储的时候,把相关的标签值、属性值、分类值和商品名称等信息(简称为商品画像) 存储到一个多值域xxx_field中。 理想切词状态下,切出 类似 以上 词(类似:笔记本电
脑超薄本,衣服 夏天 热卖,等)。
查询的时候,采用solr的faect前缀匹配和pivot机制查询。 facet.prefix、facet.pivot,piovt 的用法个人理解就是 就是按照多个维度进行分组查询,把多次faect查询集合成一次。
demo: 参考:http://mall.crecgec.com/,实现了 聚合物品所在分类。
参考词干分词器:
KeywordTokenizerFactory:这个分词器不进行任何分词!整个字符流变为单个词元。String域类型也有类似的效果,但是它不能配置文本分析的其它处理组件,比如大小写转
换。任何用于排序和大部分Faceting功能的索引域,这个索引域只有能一个原始域值中的一个词元。
简单solrj代码:
京东:
淘宝:
简单分析上图,在输入关键字部分商品含有特殊属性,分类,标签的时候 就给输入关键字提示 的下一个层级展示该标签。
用过solr的朋友,看到这个 全球购 第一时间会想到facet。
大概思路:
存储的时候,把相关的标签值、属性值、分类值和商品名称等信息(简称为商品画像) 存储到一个多值域xxx_field中。 理想切词状态下,切出 类似 以上 词(类似:笔记本电
脑超薄本,衣服 夏天 热卖,等)。
查询的时候,采用solr的faect前缀匹配和pivot机制查询。 facet.prefix、facet.pivot,piovt 的用法个人理解就是 就是按照多个维度进行分组查询,把多次faect查询集合成一次。
demo: 参考:http://mall.crecgec.com/,实现了 聚合物品所在分类。
参考词干分词器:
KeywordTokenizerFactory:这个分词器不进行任何分词!整个字符流变为单个词元。String域类型也有类似的效果,但是它不能配置文本分析的其它处理组件,比如大小写转
换。任何用于排序和大部分Faceting功能的索引域,这个索引域只有能一个原始域值中的一个词元。
<!-- 词干分词器 --> <fieldType name="suggest_text" class="solr.TextField" positionIncrementGap="100" > <analyzer> <tokenizer class="solr.WhitespaceTokenizerFactory"/> <filter class="solr.KeywordRepeatFilterFactory"/> <filter class="solr.PorterStemFilterFactory"/> <filter class="solr.LowerCaseFilterFactory" /> <filter class="solr.RemoveDuplicatesTokenFilterFactory"/> </analyzer> </fieldType> <!-- 搜索建议分词 --> <fieldType name="Word_text" class="solr.TextField" positionIncrementGap="100" autoGeneratePhraseQueries="true"> <analyzer type="index"> <!-- 不管什么内容,整句当成一个关键字 --> <tokenizer class="solr.KeywordTokenizerFactory" /> <!-- 同义词 --> <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" /> <!-- 停止词 --> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopword.dic" enablePositionIncrements="true" /> <!-- 小写过滤 --> <filter class="solr.LowerCaseFilterFactory" /> <!-- 关键字 --> <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt" /> <!-- 拆字 --> <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" /> <!-- 词干抽取算法 --> <filter class="solr.PorterStemFilterFactory"/> </analyzer> <analyzer type="query"> <tokenizer class="solr.KeywordTokenizerFactory" /> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopword.dic" enablePositionIncrements="true" /> <filter class="solr.LowerCaseFilterFactory" /> <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt" /> <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" /> <!-- 词干抽取算法 --> <filter class="solr.PorterStemFilterFactory"/> <!-- 去除重复词 --> <filter class="solr.RemoveDuplicatesTokenFilterFactory" /> </analyzer> </fieldType>
简单solrj代码:
//设置查询参数 SolrQuery query=new SolrQuery(); query.setParam("q", "*:*"); query.setStart(0); query.setRows(0); query.setParam("facet.pivot", "suggest,cate_id_3"); query.setParam("f.suggest.facet.prefix", map.get("word").toString()); query.setRequestHandler("/suggestFacet"); QueryResponse rsp= server.query(query); NamedList<List<PivotField>> namedList=rsp.getFacetPivot();
相关文章推荐
- 每个Android开发者必须知道的内存管理知识
- Write operations are not allowed in read-only mode错误
- RabbitMQ消息队列(四):分发到多Consumer(Publish/Subscribe)
- LeetCode:Sqrt(x)
- Android中两个Activity之间数据传递及返回
- 0916 编程实验一 词法分析程序 总结
- 第5章 绘图基础
- iOS:Autolayout自动布局实例
- RabbitMQ消息队列(三):任务分发机制
- 通过添加设备UDID,打包iOS应用程序,ipa包安装。
- JavaScript中Boolean对象的属性解析
- IPv6地址格式
- JAVA反射学习总
- 可以用字符流复制一张图片文件吗?
- Karaf 依赖equinox and felix,karaf 本Apache的很多项目作为基础框架
- java系统学习(十七) --------Swing组件与布局管理器
- jpa @Column说明
- RabbitMQ消息队列(二):”Hello, World“
- GeoJSON格式规范说明
- SublimeText3和EverEdit 的一些使用感受