理解lucene内几个核心概念
2012-03-19 16:00
281 查看
核心索引类:
IndexWriter
创建一个新的索引并且添加文档到一个已有的索引中,可以对索引进行增删改操作,但是不能查找。
Directory:
Lucene 索引的存放位置,是一个抽象类
实现类:
FSDirectory:在文件系统的目录中创建索引
RAMDirectory:在内存中创建索引
Analyzer:
分词器,在 IndexWriter 的构造函数中指定,用于文本内容提取关键词。
Document:
文件在lucene中的映射,是一个字段的集合
Field
每个 Document 含有一个或多个字段,具体化为 Field 类。每个字段相应于数据的一个片段
Lucene 提供四个不同的字段类型
Keyword—不被分析,但是被索引并逐字存储到索引中
UnIndexed—不被分析也不被索引,但是它的值存储到索引中。
UnStored—和 UnIndexed 相反。这个字段类型被分析并索引但是不存储在索引中。
Text—被分析并索引。
基本搜索接口:
IndexSearcher
用来搜索,简单的接受单个 Query 对象做为参数并返回一个 Hits 对象
Term
搜索的基本单元。与 Field 对象类似,它由一对字符串元素组成:字段的名称和字段的值。
Query
抽象父类。它包含一些通用方法,如 setBoost(float)用来设置权重,具体实现类有 TermQuery, BooleanQuery , PhraseQuery, PrefixQuery,PhrasePrefixQuery, RangeQuery, FilteredQuery 和 SpanQuery
Hits
Hits 类是一个搜索结果(匹配给定查询的文档)文档队列指针的简单容器。基于性能考虑,Hits的实例并不从索引中加载所有匹配查询的所有文档,而是每次加载一小部分
IndexWriter
创建一个新的索引并且添加文档到一个已有的索引中,可以对索引进行增删改操作,但是不能查找。
Directory:
Lucene 索引的存放位置,是一个抽象类
实现类:
FSDirectory:在文件系统的目录中创建索引
RAMDirectory:在内存中创建索引
Analyzer:
分词器,在 IndexWriter 的构造函数中指定,用于文本内容提取关键词。
Document:
文件在lucene中的映射,是一个字段的集合
Field
每个 Document 含有一个或多个字段,具体化为 Field 类。每个字段相应于数据的一个片段
Lucene 提供四个不同的字段类型
Keyword—不被分析,但是被索引并逐字存储到索引中
UnIndexed—不被分析也不被索引,但是它的值存储到索引中。
UnStored—和 UnIndexed 相反。这个字段类型被分析并索引但是不存储在索引中。
Text—被分析并索引。
基本搜索接口:
IndexSearcher
用来搜索,简单的接受单个 Query 对象做为参数并返回一个 Hits 对象
Term
搜索的基本单元。与 Field 对象类似,它由一对字符串元素组成:字段的名称和字段的值。
Query
抽象父类。它包含一些通用方法,如 setBoost(float)用来设置权重,具体实现类有 TermQuery, BooleanQuery , PhraseQuery, PrefixQuery,PhrasePrefixQuery, RangeQuery, FilteredQuery 和 SpanQuery
Hits
Hits 类是一个搜索结果(匹配给定查询的文档)文档队列指针的简单容器。基于性能考虑,Hits的实例并不从索引中加载所有匹配查询的所有文档,而是每次加载一小部分
相关文章推荐
- Lucene01---几个概念理解
- 理解maven的核心概念
- 从操作系统进程概念演进出发理解docker的核心原理
- 理解maven的核心概念
- 理解高性能内存缓存对象缓存Memcached原理 (Memcached核心概念,部署)
- Linux内核-深入理解Linux内核几个概念
- lucene核心概念
- 你必须理解的计算机核心概念
- css最核心的几个概念
- 基于指令的移植方式的几个重要概念的理解(OpenHMPP, OpenACC)
- lucene的几个重要概念
- 理解事务处理的核心概念
- 理解maven的核心概念
- 理解maven的核心概念
- 深入理解Spark(一):Spark核心概念RDD
- 十分钟带你理解Kubernetes核心概念
- Maven核心概念的理解
- 对敏捷开发中常用的几个"敏捷概念"的理解
- oracle中service_name、sid、tablespace、instance_name几个概念的理解
- 基础:从概念理解Lucene的Index(索引)文档模型