lucene、solr、nutch三者的关系
2016-01-30 11:24
190 查看
lucene是一个做搜索用的类库。 nutch和solr都是基于lucene的,二者都是可直接运行的应用程序;
直接在业务上使用lucene的倒是不太多见。
solr主要提供了建立索引(用户可以直接post数据给solr,然后由solr进行索引)和提供查询索引的功能(它内嵌了jetty,可以直接提供HTTP服务);
nutch一般用作爬虫使用,负责抓取数据。
solr的重大变化:从5.0开始,solr不再以war包发布(war包可以部署到任何servlet容器中),而是以独立的java服务器程序的形式发布(基于内嵌的jetty),它有启动/停止脚本,还有安装脚本用于在类unix上安装一个solr产品,后续版本不支持部署到其他的servlet容器上(如tomcat)。
直接在业务上使用lucene的倒是不太多见。
solr主要提供了建立索引(用户可以直接post数据给solr,然后由solr进行索引)和提供查询索引的功能(它内嵌了jetty,可以直接提供HTTP服务);
nutch一般用作爬虫使用,负责抓取数据。
solr的重大变化:从5.0开始,solr不再以war包发布(war包可以部署到任何servlet容器中),而是以独立的java服务器程序的形式发布(基于内嵌的jetty),它有启动/停止脚本,还有安装脚本用于在类unix上安装一个solr产品,后续版本不支持部署到其他的servlet容器上(如tomcat)。
相关文章推荐
- 微信搜一搜迈出新的一步,好戏来了
- AJAX 支持搜索引擎问题分析
- 搜索引擎对关键词作弊判断方法揭密
- 使用php记录用户通过搜索引擎进网站的关键词
- android将搜索引擎设置为中国雅虎无法搜索问题解决方法
- 在Eclipse中运行Solr 基础知识
- java Lucene 中自定义排序的实现
- Asp.Net、asp实现的搜索引擎网址收录检查程序
- 如何让搜索引擎抓取AJAX内容解决方案
- PHP判断来访是搜索引擎蜘蛛还是普通用户的代码小结
- php实现判断访问来路是否为搜索引擎机器人的方法
- php获取从百度、谷歌等搜索引擎进入网站关键词的方法
- 解析PHP对现有搜索引擎的调用
- C#判断访问来源是否为搜索引擎链接的方法
- WordPress特定文章对搜索引擎隐藏或只允许搜索引擎查看
- PHP屏蔽蜘蛛访问代码及常用搜索引擎的HTTP_USER_AGENT
- apache禁止搜索引擎收录、网络爬虫采集的配置方法
- 如何准确判断请求是搜索引擎爬虫(蜘蛛)发出的请求
- PHP统计nginx访问日志中的搜索引擎抓取404链接页面路径
- Solr 5.3.0集成mmseg4j、tomcat部署、Solrj 5.3.0使用