您的位置:首页 > 大数据

结合lucene实现大数据的like模糊查询

2017-01-05 14:55 260 查看


需求

很多时候我们在用数据库的需要使用模糊查询,我们一般会使用like语句来做,然而这样的做的效率不是很多(很抱歉我们亲自去测,很多都这么说的),那么使用Lucene来检索的话,效率会高很多。


lucene结合数据库步骤

写一段传统的JDBC程序,将每条的用户信息从数据库读取出来

针对每条用户记录,建立一个lucene document 

Document doc = new Document(); 

并根据你的需要,将用户信息的各个字段对应luncene document中的field 进行添加,如: 

doc.add(new Field(“NAME”,”USERNAME”,Field.Store.YES,Field.Index.UN_TOKENIZED)); 

然后将该条doc加入到索引中, 如: luceneWriter.addDocument(doc); 

这样就建立了lucene的索引库

编写对索引库的搜索程序(看lucene文档),通过对lucene的索引库的查找,你可以快速找到对应记录的ID

通过ID到数据库中查找相关记录

注意 

1. 在索引的过程中,可以使用增量的方式建立索引,这样对已经索引的记录不在建立索引。实现思路:保存上次(lasttime)的新增时候的id,在建立索引的时候,值查询这个id之后的记录进行索引,更新这个记录下来的id,在数据库数据修改时候,针对这个数据制作索引的修改

2.如果不用Lucene,也可以用数据库本身的“全文索引”这个很不常用的东西。oracle和mysql的新版本都支持全文索引,不喜欢Lucene的可以用这种方法。但是,但是,全文索引的本质和Lucene是一模一样的。

更多代码参考:http://blog.csdn.net/fun913510024/article/details/46289793
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: