您的位置:首页 > 其它

LuceneDemo类的演示案例:建立索引、建立搜索,另外建立一个测试类TestLucene(用到JUnit)

2015-03-22 12:01 489 查看
LuceneDemo类的演示案例:建立索引、建立搜索(需要Lucene包3.5版本)

package test;

import java.io.File;
import java.io.FileReader;
import java.io.IOException;

import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.CorruptIndexException;//
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.IndexWriterConfig.OpenMode;
import org.apache.lucene.queryParser.ParseException;//
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.store.LockObtainFailedException;//
import org.apache.lucene.util.Version;//版本

public class LuceneDemo {
	/*
	 * 建立索引index
	 */
	public void index() {
		IndexWriter writer = null;
		try {
			// 1、创建Directory,两种方式
			// Directory directory = new RAMDirectory();//建立在内存中的
			Directory directory = FSDirectory.open(new File("E:/lucene/index"));// 创建在硬盘上,如果E盘上没有lucene目录和它的index子目录,它会自动创建
			// 2、创建IndexWriter
			IndexWriterConfig iwc = new IndexWriterConfig(Version.LUCENE_35,
					new StandardAnalyzer(Version.LUCENE_35));
			iwc.setOpenMode(OpenMode.CREATE);// 每次索引都是创建新的索引而不是增量索引
			writer = new IndexWriter(directory, iwc);
			// 3、创建Document对象
			Document doc = new Document();
			// 4、为Document添加Field
			File f = new File("E:/lucene/source");// 等价于new
													// File("E:\\lucene\\source");,目录要写对
													// 不然会出错
			// 一般for循环和 增强for循环,两者用其一
			
			// 一般for循环写法
			/*File[] files = f.listFiles();// 把多个文档放在File数组中
			for (int i = 0; i < files.length; i++) {
				doc = new Document();
				doc.add(new Field("content", new FileReader(files[i])));
				doc.add(new Field("filename", files[i].getName(),
						Field.Store.YES, Field.Index.NOT_ANALYZED));//
				doc.add(new Field("path", files[i].getAbsolutePath(),
						Field.Store.YES, Field.Index.NOT_ANALYZED));
				// 5、通过IndexWriter添加到索引中
				writer.addDocument(doc);
			}*/
			// 增强for循环写法
			for (File file : f.listFiles())// 遍历多个文档
			{
				doc = new Document();
				doc.add(new Field("content", new FileReader(file)));
				doc.add(new Field("filename", file.getName(), Field.Store.YES,
						Field.Index.NOT_ANALYZED));
				doc.add(new Field("path", file.getAbsolutePath(),
						Field.Store.YES, Field.Index.NOT_ANALYZED));
				// 5、通过IndexWriter添加文档到索引中
				writer.addDocument(doc);
			}

		} catch (CorruptIndexException e) {
			e.printStackTrace();
		} catch (LockObtainFailedException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		} finally {
			try {
				if (writer != null)
					writer.close();
			} catch (CorruptIndexException e) {
				e.printStackTrace();
			} catch (IOException e) {
				e.printStackTrace();
			}
		}

	}

	/**
	 * 搜索 增量索引,因为多次创建(运行代码)索引时,会重复创建索引,使index里面相关文件增加。。。
	 */
	public void searcher() {
		try {
			// 1、创建Directory
			Directory directory = FSDirectory.open(new File("E:/lucene/index"));// 创建在硬盘上
			// 2、创建IndexReader
			IndexReader reader = IndexReader.open(directory);// 打开
			// 3、根据IndexReader创建IndexSearcher
			IndexSearcher searcher = new IndexSearcher(reader);
			// 4、创建搜索的Query,相当于SQL语句
			// 创建parser 来确定要搜索文件的内容,第二个参数表示搜索的域,域的名字要和创建索引时的域名相同
			QueryParser parser = new QueryParser(Version.LUCENE_35, "content",
					new StandardAnalyzer(Version.LUCENE_35));
			// 创建 query,表示搜索域为content中包含java的文档
			Query query = parser.parse("java");// 我们要搜索内容content里面包含java的文档
			// 5、根据searcher搜索并且返回TopDocs
			TopDocs tds = searcher.search(query, 10);// 搜索10条
			// 6、根据TopDocs获取ScoreDoc对象
			ScoreDoc[] sds = tds.scoreDocs;// 是一个数组,scoreDocs是一个属性不是一个函数
			for (ScoreDoc sd : sds) {
				// 7、根据searcher和scoreDoc对象获取具体的Document,要搜索文档的ID得要得到一个Document对象
				Document d = searcher.doc(sd.doc);
				// 8、根据Document对象获取需要的值
				System.out.println(d.get("filename") + "[" + d.get("path")
						+ "]");
				// 关闭reader
				reader.clone();
			}
		} catch (CorruptIndexException e) {
			e.printStackTrace();
		}

		catch (IOException e) {
			e.printStackTrace();
		} catch (ParseException e) {
			e.printStackTrace();
		}

	}

}


以下建立单元测试类:(需要Junit包)

package test;

import org.junit.Test;

public class TestLucene {
	@Test
	public void testIndex()
	{
		LuceneDemo ld = new LuceneDemo();
		ld.index();
	}
	@Test
	public void testSearch()
	{
		LuceneDemo ld = new LuceneDemo();
		ld.searcher();
	}

}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: