您的位置:首页 > 运维架构 > Apache

关于apache tika应用于android项目中的调查分析

2013-06-27 10:56 288 查看
最近一直在为android应用解析microsoft office文档发愁。

因为需求的原因,文档的解析只能放到客户端来做。

之前使用POI解析doc文档,但是需要做的判断很多,比如文字大小、颜色、加粗、斜体、表格、图片等等。

而且在文档图片过多的情况下很容易产生内存溢出的问题,这就需要对解析的过程做优化,比如说屏幕滚动时,清空不在屏幕上的图片。

这些东西都是从来没接触过的,都需要调查,但是调查的进展很慢,没有好的思路。

最近发现了一个叫做apache tika的东西,非常不错,值得研究。

支持大部分文件格式。但是在android项目中使用需要考虑的问题挺多,比如说做word2003文档解析,就要额外导入POI的jar包。

不然tika中的一些依赖POI方法不能正确执行。

现在痛苦于,tika解析出的word文档,不能解析图片和表格,纠结中...谁有做过带图片表格的word文档解析,在android端~
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: