LuceneDemo类的演示案例:建立索引、建立搜索,另外建立一个测试类TestLucene(用到JUnit)
2015-03-22 12:01
489 查看
LuceneDemo类的演示案例:建立索引、建立搜索(需要Lucene包3.5版本)
以下建立单元测试类:(需要Junit包)
package test; import java.io.File; import java.io.FileReader; import java.io.IOException; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.lucene.index.CorruptIndexException;// import org.apache.lucene.index.IndexReader; import org.apache.lucene.index.IndexWriter; import org.apache.lucene.index.IndexWriterConfig; import org.apache.lucene.index.IndexWriterConfig.OpenMode; import org.apache.lucene.queryParser.ParseException;// import org.apache.lucene.queryParser.QueryParser; import org.apache.lucene.search.IndexSearcher; import org.apache.lucene.search.Query; import org.apache.lucene.search.ScoreDoc; import org.apache.lucene.search.TopDocs; import org.apache.lucene.store.Directory; import org.apache.lucene.store.FSDirectory; import org.apache.lucene.store.LockObtainFailedException;// import org.apache.lucene.util.Version;//版本 public class LuceneDemo { /* * 建立索引index */ public void index() { IndexWriter writer = null; try { // 1、创建Directory,两种方式 // Directory directory = new RAMDirectory();//建立在内存中的 Directory directory = FSDirectory.open(new File("E:/lucene/index"));// 创建在硬盘上,如果E盘上没有lucene目录和它的index子目录,它会自动创建 // 2、创建IndexWriter IndexWriterConfig iwc = new IndexWriterConfig(Version.LUCENE_35, new StandardAnalyzer(Version.LUCENE_35)); iwc.setOpenMode(OpenMode.CREATE);// 每次索引都是创建新的索引而不是增量索引 writer = new IndexWriter(directory, iwc); // 3、创建Document对象 Document doc = new Document(); // 4、为Document添加Field File f = new File("E:/lucene/source");// 等价于new // File("E:\\lucene\\source");,目录要写对 // 不然会出错 // 一般for循环和 增强for循环,两者用其一 // 一般for循环写法 /*File[] files = f.listFiles();// 把多个文档放在File数组中 for (int i = 0; i < files.length; i++) { doc = new Document(); doc.add(new Field("content", new FileReader(files[i]))); doc.add(new Field("filename", files[i].getName(), Field.Store.YES, Field.Index.NOT_ANALYZED));// doc.add(new Field("path", files[i].getAbsolutePath(), Field.Store.YES, Field.Index.NOT_ANALYZED)); // 5、通过IndexWriter添加到索引中 writer.addDocument(doc); }*/ // 增强for循环写法 for (File file : f.listFiles())// 遍历多个文档 { doc = new Document(); doc.add(new Field("content", new FileReader(file))); doc.add(new Field("filename", file.getName(), Field.Store.YES, Field.Index.NOT_ANALYZED)); doc.add(new Field("path", file.getAbsolutePath(), Field.Store.YES, Field.Index.NOT_ANALYZED)); // 5、通过IndexWriter添加文档到索引中 writer.addDocument(doc); } } catch (CorruptIndexException e) { e.printStackTrace(); } catch (LockObtainFailedException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } finally { try { if (writer != null) writer.close(); } catch (CorruptIndexException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } } } /** * 搜索 增量索引,因为多次创建(运行代码)索引时,会重复创建索引,使index里面相关文件增加。。。 */ public void searcher() { try { // 1、创建Directory Directory directory = FSDirectory.open(new File("E:/lucene/index"));// 创建在硬盘上 // 2、创建IndexReader IndexReader reader = IndexReader.open(directory);// 打开 // 3、根据IndexReader创建IndexSearcher IndexSearcher searcher = new IndexSearcher(reader); // 4、创建搜索的Query,相当于SQL语句 // 创建parser 来确定要搜索文件的内容,第二个参数表示搜索的域,域的名字要和创建索引时的域名相同 QueryParser parser = new QueryParser(Version.LUCENE_35, "content", new StandardAnalyzer(Version.LUCENE_35)); // 创建 query,表示搜索域为content中包含java的文档 Query query = parser.parse("java");// 我们要搜索内容content里面包含java的文档 // 5、根据searcher搜索并且返回TopDocs TopDocs tds = searcher.search(query, 10);// 搜索10条 // 6、根据TopDocs获取ScoreDoc对象 ScoreDoc[] sds = tds.scoreDocs;// 是一个数组,scoreDocs是一个属性不是一个函数 for (ScoreDoc sd : sds) { // 7、根据searcher和scoreDoc对象获取具体的Document,要搜索文档的ID得要得到一个Document对象 Document d = searcher.doc(sd.doc); // 8、根据Document对象获取需要的值 System.out.println(d.get("filename") + "[" + d.get("path") + "]"); // 关闭reader reader.clone(); } } catch (CorruptIndexException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } catch (ParseException e) { e.printStackTrace(); } } }
以下建立单元测试类:(需要Junit包)
package test; import org.junit.Test; public class TestLucene { @Test public void testIndex() { LuceneDemo ld = new LuceneDemo(); ld.index(); } @Test public void testSearch() { LuceneDemo ld = new LuceneDemo(); ld.searcher(); } }
相关文章推荐
- 用lucene为数据库搜索建立 增量索引
- 用lucene为数据库搜索建立增量索引
- 用Lucene.net对数据库建立索引及搜索 (2)
- 用lucene为数据库搜索建立增量索引
- lucene(全文搜索)_建立索引_根据关键字全文搜索_源码下载
- 针对Lucene 建立索引过程与搜索过程耗费时间的矛盾一点思路
- Lucene.Net核心类简介,创建索引,搜索,Lucene高亮组建演示,Rss获得最新帖子,只索引帖子的有意义部分,在AddDocument之前先移除旧有文档.
- 转 lucene3搜索引擎,索引建立搜索排序分页高亮显示, IKAnalyzer分词
- 使用Lucene对建立的索引进行搜索
- Lucene建立索引搜索入门实例
- 用lucene为数据库搜索建立增量索引
- Lucene.NET建立,搜索多个索引文件
- 用Lucene.net对数据库建立索引及搜索2
- [转]用Lucene.net对数据库建立索引及搜索
- 用Lucene.net对数据库建立索引及搜索
- 用Lucene.net对数据库建立索引及搜索
- 用Lucene.net对数据库建立索引及搜索<转>
- lucene3.0全站搜索建立索引时的编码处理
- 用Lucene[1].net对数据库建立索引及搜索+
- lucene3.0+版本中文分词测试+搜索结果+创建索引测试