nutch和lucene的关系
2014-04-15 17:26
239 查看
Nutch 是基于Lucene的。Lucene为 Nutch 提供了文本索引和搜索的API。
一个常见的问题是;我应该使用Lucene还是Nutch?最简单的回答是:如果你不需要抓取数据的话,应该使用Lucene。如果你有数据源,需要为这些数据提供一个搜索页面。在这种情况下,最好的方式是直接从数据库中取出数据并用LuceneAPI建立索引。Nutch 适用于你无法直接获取数据库中的网站,或者比较分散的数据源的情况下使用。
Lucene其实是一个提供全文文本搜索的函数库,它不是一个应用软件。它提供很多API函数让你可以运用到各种实际应用程序中。现在,它已经成为Apache的一个项目并被广泛应用。
Nutch是一个建立在Lucene核心之上的Web搜索的实现,它是一个真正的应用程序。也就是说,你可以直接下载下来拿过来用。它在Lucene的基础上加了网络爬虫和一些和Web相关的东东。其目的就是想从一个简单的站内索引和搜索推广到全球网络的搜索上。
一个常见的问题是;我应该使用Lucene还是Nutch?最简单的回答是:如果你不需要抓取数据的话,应该使用Lucene。如果你有数据源,需要为这些数据提供一个搜索页面。在这种情况下,最好的方式是直接从数据库中取出数据并用LuceneAPI建立索引。Nutch 适用于你无法直接获取数据库中的网站,或者比较分散的数据源的情况下使用。
Lucene其实是一个提供全文文本搜索的函数库,它不是一个应用软件。它提供很多API函数让你可以运用到各种实际应用程序中。现在,它已经成为Apache的一个项目并被广泛应用。
Nutch是一个建立在Lucene核心之上的Web搜索的实现,它是一个真正的应用程序。也就是说,你可以直接下载下来拿过来用。它在Lucene的基础上加了网络爬虫和一些和Web相关的东东。其目的就是想从一个简单的站内索引和搜索推广到全球网络的搜索上。
相关文章推荐
- Lucene,Nutch,Hadoop 之间有什么关系?
- Lucene、Nutch和Hadoop三者之间的关系
- 5.搜索之路——solr与lucene和nutch关系
- (转)Lucene,Nutch,Hadoop 之间有什么关系?
- lucene、solr、nutch三者的关系
- solr ,hadoop ,lucene,nutch 的关系和区别
- lucene、solr、nutch三者的关系
- Hadoop与Lucene和Nutch的关系
- Lucene关系数据库的使用
- 什么是Lucene,什么是Nutch
- 学习搜索开发的重点不在lucene和nutch[ 原创]
- lucene-Nutch分析
- Doug Cutting (Lucene-Nutch-Hadoop 创始人简介)
- Lucene 3.02中的类及其继承关系
- 全文索引-lucene,solr,nutch,hadoop之solr
- 1.搜索之路——Nutch与Lucene
- 利用Lucene与Nutch构建简单的全文搜索引擎
- elasticsearch和lucene的关系以及elasticsearch的核心概念
- Doug Cutting (Lucene-Nutch-Hadoop 创始人简介)
- Spirit+lucene+nutch