您的位置:首页 > 其它

Solr 文章集成

2015-08-14 13:16 281 查看
文章转自:http://blog.csdn.net/zhaoyue007101/article/details/47130007

Solr 文章集成

solr原理

solr wiki: http://wiki.apache.org/solr/
分布式全文检索系统SolrCloud简介 /article/3503899.html
collection,shard,core,leader,replica
solr组件图,http://www.solr.cc/blog/?attachment_id=106
索引组件,检索组件:solrconfig配置
流水线各组件,schema.xml配置
数据导入时,先更新到leader再同步到replica
solr数据提交分为两种,软提交和硬提交,是否开启随时提交在solrconfig中配置
solr机群的机器数量最好提前规划

构建索引分词。

Solr之中文分词。 /article/1502087.html
在schema.xml中配,在相关wiki中很详细
配置同义词词典,停用词词典,扩展词词词典,查询&索引,停用词,同义词filter等。http://v.youku.com/v_show/id_XNTgwODU4MTgw.html?from=y1.7-2

query分词。

分词叫做analyzer
Solr 使用自定义 Query Parser

http://blog.chenlb.com/2010/08/solr-use-custom-query-parser.html

查询参数。

Solr查询详解/article/5512075.html
Solr 使用自定义 Query Parser. http://www.jisu3d.com/2010/0526/22459.html

查询结果排序。 Ranked retrieval

完全匹配排在首位 http://chenzhenianqing.cn/articles/888.html
Solrj 排序样例汇总。http://blog.sina.com.cn/s/blog_4d58e3c00101h5xc.html
Solr搜索的排序打分规则探讨 http://elastos.org/redmine/boards/23/topics/348
Solr设定不同字段的权重,根据相关度和业务字段综合排序搜索

http://outofmemory.cn/java/solr/search-function-query-effect-result-order
Solr In Action 笔记(2) 之评分机制(相似性计算) /article/5998394.html

相关搜索,Spell-checking

solr 百度相关搜索类似功能的实现 http://www.sxt.cn/u/2715/blog/4240
Solr搜索配置关联词synonyms。 /article/3558089.html
小试 solr 的 spellcheck。 http://blog.chenlb.com/2009/02/try-solr-spellcheck.html

8.solr3.4 高亮(highlight),拼写检查(spellCheck),匹配相似(moreLikeThis) 应用实践 /article/4153998.html
http://yingbin920.iteye.com/blog/1568769

结果高亮。

solr学习笔记四:了解solr查询语法。http://www.guoweiwei.com/archives/830,也是通过文件进行配置。
高亮及自动完成。http://wenku.baidu.com/link?url=13c4goagyCTBruYgYAmsoTmG-72D6dgr5bL20wDTyduZPtvyZaBCyTKkx9bZMFQtHZTYq5JieecTK6JNfVnxZ_Ri6YWMG85Nzs8A4vRD7Sa

Faceting
Autosuggest
结果统计Stats,url参数中,增加stats=true
More Like This component,相似文档搜索。
Debug component,debug模式开启,查看返回结果具体参数,&debugQuery=true。
solr cloud

solr在初始化一个collection的时候,可以设置好sharedNumber,Shard Splitting,在shared保存文档达到阈值,或接收到API的命令,可以split为多个。
shared split:&shard=[shard_name]&action=SPLITSHARD]http://host:port/solr/admin/collections?collection=[your_collection_name]&shard=[shard_name]&action=SPLITSHARD

Cache及冷启动

Solr缓存 http://www.solr.cc/blog/?p=999
Filter Cache http://www.solr.cc/blog/?p=239
改进Solr性能 /article/2808705.html

SolrJ示例

数据入库方式优化:http://www.solr.cc/blog/?p=96
SolrJ查询示例 http://www.solrtutorial.com/solrj-tutorial.html
http://www.solr.cc/blog/?p=1296

使用solr的系统。

简单搜索系统组成总结

http://www.wklken.me/posts/2014/06/09/search-system.html
使用 Apache Solr 实现更加灵巧的搜索,第 1 部分: 基本特性和 Solr 模式 http://www.ibm.com/developerworks/cn/java/j-solr1/

文档资料

csdn pdf: http://www.csdn.net/tag/solr
优酷资料: http://i.youku.com/solrcn

solr配置文件

schema.xml: solr的实例,有多少字段,每个字段是什么类型,每个字段如何分词。

http://wiki.apache.org/solr/SchemaXml

solrconfig:索引的配置,缓存用多大,哪些地方用缓存,用哪些检索的分析器。

http://wiki.apache.org/solr/SolrConfigXml

性能调优

Solr 性能因素 http://www.solr.cc/blog/?p=58
Solr调优参考 http://itindex.net/detail/40572-solr
solr性能调优(taobaoer推荐)http://xiaoyezi1128.iteye.com/blog/560685
Solr调优参考 http://www.blogjava.net/conans/articles/379550.html
Solr调优参考(三篇)

http://itindex.net/detail/37725-solr

jvm配置

参考solr in action第12章。要配置运行堆栈大小上下限以及垃圾回收参数。

solr query日志挖掘。

关于搜索挖掘所想 http://jm-blog.aliapp.com/?p=2110
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: