您的位置:首页 > 其它

lucene StringIndexOutOfBoundsException

2012-05-23 11:59 281 查看
全文检索如果用中文分词的庖丁解牛,在索引中进行查询的时候,给查询的关键字加上高亮的时候会出现一个错误,而这个错误时庖丁解牛的一个BUG,需要修改源码。


lucene StringIndexOutOfBoundsException

你这个是在高亮的时候出的错误吧。庖丁源码问题, 庖丁默认一次读取128个字符去分词,当剩最后一个字符时,庖丁有时会添油加醋的加上一个源文件不存在的字,并且把位置偏移量加了1。 高亮时要截取文本, substring一个超文本长度的偏移量就报那个错误了
http://lucene-group.group.iteye.com/group/topic/11433
apache bug url:https://issues.apache.org/jira/browse/LUCEN
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: