您的位置:首页 > 其它

Lucene使用(三)常用的查询规则

2017-12-25 13:33 609 查看
在上一篇Lucene使用(二)索引的增删改查中,使用的查询规则是Lucene中的多域搜索。此外,在Lucene中查询还可以使用Query的如下子类:



这其中,每个子类相当于一种查询规则,这里仅列举一些常用的。

新建测试类TestLucene03,并且使用上一篇中的方法添加索引数据:
package net.xxpsw.demo.lucene.test;
import java.util.ArrayList;
import java.util.List;
import org.junit.Test;
import net.xxpsw.demo.lucene.bean.Article;
import net.xxpsw.demo.lucene.dao.LuceneDao;
public class TestLucene03 {
private LuceneDao luceneDao = new LuceneDao();

@Test
public void testAdd() throws Exception {
List<Article> articles = new ArrayList<Article>();
articles.add(new Article(1, "Lucene使用(一)简单索引的创建和检索", "xxpsw", "简单索引的创建和检索", "http://blog.csdn.net/xxpsw/article/details/78751630"));
articles.add(new Article(2, "Lucene使用(二)索引的增删改查", "xxpsw", "索引的增删改查", "http://blog.csdn.net/xxpsw/article/details/78794363"));
articles.add(new Article(3, "Lucene使用(三)常用的查询规则", "xxpsw", "常用的查询规则", "http://blog.csdn.net/xxpsw/article/details/78891779"));
luceneDao.addIndex(articles);
}
}
新建测试方法testSearch用以在控制台打印查询结果:
private void testSearch(Query query) throws Exception {
List<Article> articlelist = new ArrayList<Article>();
IndexSearcher indexSearcher = LuceneUtils.getIndexSearcher();
TopDocs topDocs = indexSearcher.search(query, 100);
Article article = null;
ScoreDoc scoreDocs[] = topDocs.scoreDocs;
for (int i = 0; i < scoreDocs.length; i++) {
int docID = scoreDocs[i].doc;
Document document = indexSearcher.doc(docID);
article = ArticleUtils.documentToArticle(document);
articlelist.add(article);
}
Gson gson = new GsonBuilder().setPrettyPrinting().create();
System.out.println(gson.toJson(articlelist));
}

1. 查询所有(MatchAllDocsQuery)

使用MatchAllDocsQuery可以构建一个没有任何条件的Query,用于返回所有的文档,新建方法testMatchAllDocsQuery:
/**
* @Description: 查询所有(MatchAllDocsQuery)
* @throws Exception
*/
@Test
public void testMatchAllDocsQuery() throws Exception {
4000

MatchAllDocsQuery matchAllDocsQuery = new MatchAllDocsQuery();
testSearch(matchAllDocsQuery);
}
执行测试方法,控制台打印如下:



2. 精确查询(TermQuery)

使用TermQuery可以根据指定的字段值精确查询文档,新建测试方法testTermQuery:
/**
* @Description: 精确查询(TermQuery)
* @throws Exception
*/
@Test
public void testTermQuery() throws Exception {
TermQuery termQuery = new TermQuery(new Term("title", "常"));
testSearch(termQuery);
}
由于默认分词器对中文的分词是单个汉字,所以此处使用单个汉字进行查询,测试结果如下:



3. 短语查询(PhraseQuery)

使用PhraseQuery可以构建包含若干个词的短语模板,然后根据该短语模板匹配合适的文档,新建测试方法testPhraseQuery:
/**
* @Description: 短语查询(PhraseQuery)
* @throws Exception
*/
@Test
public void testPhraseQuery() throws Exception {
PhraseQuery phraseQuery = new PhraseQuery.Builder()
.add(new Term("title", "常"), 0)
.add(new Term("title", "查"), 3)
.add(new Term("title", "则"), 6)
.build();
testSearch(phraseQuery);
}
为了方便观察,在testSearch(phraseQuery)处加上断点,debug模式执行测试方法,断点信息如下:



此处可见包含“常”、“查”、“则”三个词的短语 “常 ? ? 查 ? ? 则”,而三个词在该短语中的下标分别是0、3、6,继续执行,控制台打印结果如下:



4. 通配符查询(WildcardQuery)

WildcardQuery是MultiTermQuery的一个子类,使用WildcardQuery可以实现通配符查询,具体来说,?代表单个字母,*代表0或多个字母,新建测试方法testWildcardQuery:
/**
* @Description: 通配符查询(WildcardQuery)
* @throws Exception
*/
@Test
public void testWildcardQuery() throws Exception {
WildcardQuery wildcardQuery = new WildcardQuery(new Term("author", "x*?"));
testSearch(wildcardQuery);
}
执行测试方法,结果如下:



5. 模糊查询(FuzzyQuery)

FuzzyQuery是MultiTermQuery的一个子类,使用FuzzyQuery可以简单地识别两个近似的词,实现相似度匹配,新建测试方法testFuzzyQuery:
/**
* @Description: 模糊查询(FuzzyQuery)
* @throws Exception
*/
@Test
public void testFuzzyQuery() throws Exception {
FuzzyQuery fuzzyQuery = new FuzzyQuery(new Term("author", "xxp11"), 2);
testSearch(fuzzyQuery);
}
此处author的正确值是xxpsw,而与之相匹配的查询值是xxp11,此处允许2个错误字符,因此是可以查询出相关文档的。一般来说,错误字符的数量取值为0、1、2三者中的一个。执行测试方法,控制台打印如下:



6. 范围查询(NumericRangeQuery)

NumericRangeQuery是MultiTermQuery的一个子类,使用NumericRangeQuery可以实现数字类型的数据查询,新建测试方法testNumericRangeQuery:
/**
* @Description: 范围查询(NumericRangeQuery)
* @throws Exception
*/
@Test
public void testNumericRangeQuery() throws Exception {
// (字段名称,最小值,最大值,是否包含最小值,是否包含最大值)
NumericRangeQuery<?> newIntRange = NumericRangeQuery.newIntRange("id", 2, 3, false, true);
testSearch(newIntRange);
}
执行测试方法,结果如下:



7. 布尔查询(BooleanQuery)

使用BooleanQuery可以建立多个Query之间的联系,从而实现满足多个条件的复杂查询,新建测试方法testBooleanQuery:
/**
* @Description: 布尔查询(BooleanQuery)
* @throws Exception
*/
@Test
public void testBooleanQuery() throws Exception {
TermQuery query01 = new TermQuery(new Term("title", "一"));
TermQuery query02 = new TermQuery(new Term("title", "三"));
BooleanQuery booleanQuery = new BooleanQuery.Builder()
.add(query01, Occur.SHOULD)
.add(query02, Occur.SHOULD)
.build();
testSearch(booleanQuery);
}
指示Query使用场景的枚举包含Occur.MUST,Occur.SHOULD,Occur.MUST_NOT。一般来说,MUST和MUST连用表示取多个查询结果的交集,SHOULD和SHOULD连用表示取多个查询结果的并集,MUST和MUST_NOT连用表示查询结果中不包含MUST_NOT子句所对应的查询结果。执行测试方法,打印结果如下:

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: