您的位置:首页 > 其它

lucene 解析文档

2012-08-21 20:45 239 查看
DocumentHandler接口

处理InputStream对象

生成一个lucene的document的对象

SAX或digest从xml中提取文本信息

用PDFBox从PDF中提取文本信息

使用Jtity从html中提取文本信息

使用NekoHTML从html中提取文本信息

使用POI和textmining提取word中的文本信息

使用javax.swing.text.rtf解析RTF文档
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: