关于apache tika应用于android项目中的调查分析
2013-06-27 10:56
288 查看
最近一直在为android应用解析microsoft office文档发愁。
因为需求的原因,文档的解析只能放到客户端来做。
之前使用POI解析doc文档,但是需要做的判断很多,比如文字大小、颜色、加粗、斜体、表格、图片等等。
而且在文档图片过多的情况下很容易产生内存溢出的问题,这就需要对解析的过程做优化,比如说屏幕滚动时,清空不在屏幕上的图片。
这些东西都是从来没接触过的,都需要调查,但是调查的进展很慢,没有好的思路。
最近发现了一个叫做apache tika的东西,非常不错,值得研究。
支持大部分文件格式。但是在android项目中使用需要考虑的问题挺多,比如说做word2003文档解析,就要额外导入POI的jar包。
不然tika中的一些依赖POI方法不能正确执行。
现在痛苦于,tika解析出的word文档,不能解析图片和表格,纠结中...谁有做过带图片表格的word文档解析,在android端~
因为需求的原因,文档的解析只能放到客户端来做。
之前使用POI解析doc文档,但是需要做的判断很多,比如文字大小、颜色、加粗、斜体、表格、图片等等。
而且在文档图片过多的情况下很容易产生内存溢出的问题,这就需要对解析的过程做优化,比如说屏幕滚动时,清空不在屏幕上的图片。
这些东西都是从来没接触过的,都需要调查,但是调查的进展很慢,没有好的思路。
最近发现了一个叫做apache tika的东西,非常不错,值得研究。
支持大部分文件格式。但是在android项目中使用需要考虑的问题挺多,比如说做word2003文档解析,就要额外导入POI的jar包。
不然tika中的一些依赖POI方法不能正确执行。
现在痛苦于,tika解析出的word文档,不能解析图片和表格,纠结中...谁有做过带图片表格的word文档解析,在android端~
相关文章推荐
- 我的Android进阶之旅------>Android项目目录结构分析
- 关于Android导入开源项目:Error:Unable to load class 'org.gradle.api.publication.maven.internal.DefaultMavenFa
- Android 关于 CountDownTimer onTick() 倒计时不准确问题源码分析
- Android中从源码分析关于AsyncTask的使用
- 关于Android多项目依赖在Eclipse中无法关联源代码的问题解决
- Android项目下目录分析(Android第一行代码学习笔记3)
- 有关于android mat分析中 系统默认加载的sPreloadedDrawables
- 关于android中手势操作相关类GestureDetector类的分析
- Android中从源码分析关于AsyncTask的使用
- Android 开源项目源码分析第一期正式发布
- android关于AndroidManifest.xml详细分析
- 关于如何正确地在android项目中添加第三方jar包
- 关于Android的面试题(笔试题)---选择(个人分析)
- Android关于Theme.AppCompat相关问题的深入分析
- 关于android项目编译不通过,类名爆红的问题
- Android关于Theme.AppCompat相关问题的深入分析
- 关于助听器市场销售的调查分析
- android关于AndroidManifest.xml详细分析
- Android从零开搞系列:自定义View(4)基本的自定义ViewPager指示器+开源项目分析(上)
- 1、Android项目框架搭建 (分析需求、整理资料)