PDF文档解析java Big Faceless
2009-04-18 22:01
337 查看
最近在公司实习,由于公司的项目,公司要求我们做解析文档的部分任务,首先我做的是PDF文档的解析,主管也说了,这是最简单的,用开源的JAVA库PDFbox就能解决,不过,pdfbox还不支持新的PDF1.7版本。我在网上搜索,终于找到了能支持PDF1.7版本的开源库了。The Big Faceless PDF Library可以到一下网站下载PDF包:里面有较详细的文档说明。 http://big.faceless.org/products/pdf/
发现比PDFbox还简单。
下面是我的代码:
import java.io.*;
import org.faceless.pdf2.*;
public class PrintPDF {
public static void main(String[] args) throws IOException {
//PDF文档路径
String filepath = "d://userguide.pdf";
//PDFReader对象建立
PDFReader reader = new PDFReader(new File(filepath));
//建立PDF文档对象
PDF pdf = new PDF(reader);
//建立文档解析对象
PDFParser parser = new PDFParser(pdf);
for (int i = 0; i < pdf.getNumberOfPages(); i++) {
PageExtractor extractor = parser.getPageExtractor(i);
System.out.println(extractor.getTextAsStringBuffer());
}
}
}
发现比PDFbox还简单。
下面是我的代码:
import java.io.*;
import org.faceless.pdf2.*;
public class PrintPDF {
public static void main(String[] args) throws IOException {
//PDF文档路径
String filepath = "d://userguide.pdf";
//PDFReader对象建立
PDFReader reader = new PDFReader(new File(filepath));
//建立PDF文档对象
PDF pdf = new PDF(reader);
//建立文档解析对象
PDFParser parser = new PDFParser(pdf);
for (int i = 0; i < pdf.getNumberOfPages(); i++) {
PageExtractor extractor = parser.getPageExtractor(i);
System.out.println(extractor.getTextAsStringBuffer());
}
}
}
相关文章推荐
- Big Faceless Java PDF 阅读器
- 自己动手写搜索引擎(常搜吧历程六#解析文档之PDF#)(Java、Lucene、hadoop)
- JAVA解析PDF、WORD、EXCEL文档
- Big Faceless Java Pdf报表生成器控件介绍
- java对office、pdf文档在线预览解析(融合进项目中)
- Big Faceless Java Pdf报表生成器
- Java对XML文档进行解析
- apache poi操作office文档----java在线预览txt、word、ppt、execel,pdf代码
- XML文档基本认识和基于JAVA对简单解析
- Java解析XML文档
- 使用DOM解析XML文档示例(Java)
- (java office转pdf) MS Office2010、WPS2015、OpenOffice4用Java将Office文档转换为PDF,WIN7 64位系统
- 使用java生成pdf文档
- JAVA POI excel文档解析与生成
- 解析XML文档(java)
- JAVA读取XML,JAVA读取XML文档,JAVA解析XML文档,JAVA与XML,XML文档解析(Document Object Model, DOM)
- Java Web项目中利用FreeMarker模板生成的word文档,其它格式文档同理,如pdf,txt,java,xml等等
- XML的DOM解析 Java实现 使用递归解析一个XML文档
- Java处理Word, Excel, PDF文档的4种开源系统的代码例子
- 解析html文档的java库及范例