关于lucene断点续索引和增量索引的问题
2007-03-27 12:09
295 查看
关于lucene断点续索引和增量索引的问题
1、像百度、google等桌面搜索建立索引的时候可以停止后重新索引,他能保证以前索引过的文件重新索引的时候不用再索引吗?如果停止后要索引的文件进行了删除和添加等操作,那么他是怎么处理的以保证索引文件的覆盖率。用lucene索引文件的时候如何实现这种功能,给个思路。
2、如何在我给一个目录里添加一个文件的时候自动把这个文件用lucene索引起来,就是所谓的增量索引,难道用个timer扫描目录变化或者用filewatch来监视这个目录,然后对其索引吗?可是这样的话必须做个windows服务了,要不这个软件关闭的话就不能相应目录里文件的变化了。
3、如果一个文件修改或者删除了,如何同步到索引里,用IndexReader找这个Document的时候考什么去找,必须要在Document里放一个类似于主键的域来找到它,并删除或者重新建立索引吗?
就这3问题,大家给说说思路,谢谢。
1、像百度、google等桌面搜索建立索引的时候可以停止后重新索引,他能保证以前索引过的文件重新索引的时候不用再索引吗?如果停止后要索引的文件进行了删除和添加等操作,那么他是怎么处理的以保证索引文件的覆盖率。用lucene索引文件的时候如何实现这种功能,给个思路。
2、如何在我给一个目录里添加一个文件的时候自动把这个文件用lucene索引起来,就是所谓的增量索引,难道用个timer扫描目录变化或者用filewatch来监视这个目录,然后对其索引吗?可是这样的话必须做个windows服务了,要不这个软件关闭的话就不能相应目录里文件的变化了。
3、如果一个文件修改或者删除了,如何同步到索引里,用IndexReader找这个Document的时候考什么去找,必须要在Document里放一个类似于主键的域来找到它,并删除或者重新建立索引吗?
就这3问题,大家给说说思路,谢谢。
相关文章推荐
- 关于lucene断点续索引和增量索引的问题zz
- 关于lucene断点续索引和增量索引的问题
- 关于Lucene断点续索引和增量索引的问题
- 关于Lucene.net 2.9.2.2 中删除索引的若干问题
- 关于Lucene.net 2.9.2.2 中删除索引的若干问题
- 关于Lucene3.0的删除索引问题
- 关于Lucene增量索引
- 关于 Oracle外键列上是否需要索引问题?
- 关于数据库索引建立的原则及问题
- 用lucene为数据库搜索建立 增量索引
- 关于MYSQL索引优化和in or替换为union all的问题
- Lucene.Net 增量索引
- 关于DB索引、一致性哈希算法的思考(我认为都是解决伸缩性的问题)
- 关于ORA-01654: 索引 DISNEYEPORTAL.IND_SHOP_TRADES_RECORD_TID 无法通过 128 (在表空间 TS_IDX_WF 中) 扩展问题
- 解决lucene 重复索引的问题
- 关于codeblocks断点调试问题
- 有关Lucene的问题(8):用Lucene构建实时索引的文档更新问题
- 关于模糊查询时的索引问题.(了解一下,对提高代码效率非常有好处)
- lucene的写索引的操作问题
- 关于解决webstorm下的npm一直显示更新索引,引起卡顿问题