关于Lucene索引合并解决方法
2011-12-19 22:38
387 查看
http://damies.iteye.com/blog/1598352008-01-28
luceneApache中间件WebF#由于Clustor的问题造成无法对索引进行同步,脑子中马上浮现用rmi(双机),UDP广播(多机)作通信中间件对clustor进行索引同步但这样经过测试后效率相对较低,故另辟蹊径,最终用索引合并的方式进行快速的索引整合,达到时间短索引同步快的目的。代码如下:
Java代码
package com.pccw;
import java.io.File;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.store.FSDirectory;
public class AdvancedTextFileIndexer {
/**
* @author Shane Zhao about merge Index in PCCW BJDEV
* 将小索引文件合并到大的索引文件中去
*
* @param from
* 将要合并到to文件的文件
* @param to
* 将from文件合并到该文件
* @param sa
*/
private static void mergeIndex(File from, File to,StandardAnalyzer sa) {
IndexWriter indexWriter = null;
try {
System.out.println("正在合并索引文件!\t ");
indexWriter = new IndexWriter(to, sa, false);
indexWriter.setMergeFactor(100000);
indexWriter.setMaxFieldLength(Integer.MAX_VALUE);
indexWriter.setMaxBufferedDocs(Integer.MAX_VALUE);
indexWriter.setMaxMergeDocs(Integer.MAX_VALUE);
FSDirectory[] fs = { FSDirectory.getDirectory(from, false) };
indexWriter.addIndexes(fs);
indexWriter.optimize();
indexWriter.close();
System.out.println("已完成合并!\t ");
} catch (Exception e) {
System.out.println("合并索引出错!");
e.printStackTrace();
} finally {
try {
if (indexWriter != null)
indexWriter.close();
} catch (Exception e) {
}
}
}
public static void main(String[] areg){
File from = new File("F:/web/faq/lucene/indexDir");
File to = new File("F:/indexDir");
mergeIndex(from,to,new StandardAnalyzer());
}
}
测试效率为两个150M的索引文件合并时间在10-15s 效率还是很令人满意的。
关于Lucene索引合并解决方法
博客分类: JAVA技术luceneApache中间件WebF#由于Clustor的问题造成无法对索引进行同步,脑子中马上浮现用rmi(双机),UDP广播(多机)作通信中间件对clustor进行索引同步但这样经过测试后效率相对较低,故另辟蹊径,最终用索引合并的方式进行快速的索引整合,达到时间短索引同步快的目的。代码如下:
Java代码
package com.pccw;
import java.io.File;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.store.FSDirectory;
public class AdvancedTextFileIndexer {
/**
* @author Shane Zhao about merge Index in PCCW BJDEV
* 将小索引文件合并到大的索引文件中去
*
* @param from
* 将要合并到to文件的文件
* @param to
* 将from文件合并到该文件
* @param sa
*/
private static void mergeIndex(File from, File to,StandardAnalyzer sa) {
IndexWriter indexWriter = null;
try {
System.out.println("正在合并索引文件!\t ");
indexWriter = new IndexWriter(to, sa, false);
indexWriter.setMergeFactor(100000);
indexWriter.setMaxFieldLength(Integer.MAX_VALUE);
indexWriter.setMaxBufferedDocs(Integer.MAX_VALUE);
indexWriter.setMaxMergeDocs(Integer.MAX_VALUE);
FSDirectory[] fs = { FSDirectory.getDirectory(from, false) };
indexWriter.addIndexes(fs);
indexWriter.optimize();
indexWriter.close();
System.out.println("已完成合并!\t ");
} catch (Exception e) {
System.out.println("合并索引出错!");
e.printStackTrace();
} finally {
try {
if (indexWriter != null)
indexWriter.close();
} catch (Exception e) {
}
}
}
public static void main(String[] areg){
File from = new File("F:/web/faq/lucene/indexDir");
File to = new File("F:/indexDir");
mergeIndex(from,to,new StandardAnalyzer());
}
}
测试效率为两个150M的索引文件合并时间在10-15s 效率还是很令人满意的。
相关文章推荐
- 关于Lucene索引合并解决方法
- 关于解决margin合并(折叠)的方法
- Lucene3.0.2之IndexWriter之updateDocument无法更新索引之解决方法
- 关于Android中调用了post方法后貌似没有执行run方法的解释及解决办法
- 关于java的JDK环境变量设置方法及相关问题解决方案
- 关于登陆界面背景图片缩放变形的解决方法
- H5关于IOS安卓app的mp4视频播放全屏解决方法
- 关于在XP下启动Android模拟器出现的内存不能为written的解决方法
- 关于遇到问题的解决方法(仅此献给初学者吧,我工作还没两年,这点经验对于大神,不值一谈的)
- 关于Cannot send session cache limiter - headers already sent错误解决方法
- 关于Android Studio新建Project时报错的解决方法
- 关于javac编译时出现“非法字符:\65279”的解决方法
- 关于Delphi 7 “'System.pas' not found” 错误的解决方法
- 关于method not exist:think\db\Query->render错误解决方法
- 关于windows7 IIS 7.5和Vista IIS 7.0 局域网无法访问的解决方法
- 关于Foxmail不支持IMAP收取Gmail的解决方法
- 关于python第三方库安装失败的解决方法
- 关于微信屏蔽淘宝页面的解决方法(转)
- 关于水晶报表慢的解决方法
- 关于ECSHOP模板架设的服务器php版本过高报错的解决方法(二)