用Java读取word中的数据
2008-07-14 16:49
405 查看
用Java简单的读取word文档中的数据:
第一步:下载tm-extractors-0.4.jar
下载地址:http://drc-dev.ohiolink.edu/browser/elated-core/trunk/lib/tm-extractors-0.4.jar?rev=46 并把它放到你的classpath路径下面。
第二步:简单的程序.(WordReader .java)
前提是你的E盘下有个Strust.doc文件。
import java.io.File;
import java.io.FileInputStream;
import org.textmining.text.extraction.WordExtractor;
public class WordReader {
public static String readDoc(String doc) throws Exception {
// 创建输入流读取doc文件
FileInputStream in = new FileInputStream(new File(doc));
WordExtractor extractor = null;
String text = null;
// 创建WordExtractor
extractor = new WordExtractor();
// 对doc文件进行提取
text = extractor.extractText(in);
return text;
}
/**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
try{
String text = WordReader.readDoc("E:/Strust.doc");
System.out.println(text);
}catch(Exception ex){
ex.printStackTrace();
}
}
}
这样就简单的完成了从word中读取数据了。你可以把它生成一个txt的文件。
第一步:下载tm-extractors-0.4.jar
下载地址:http://drc-dev.ohiolink.edu/browser/elated-core/trunk/lib/tm-extractors-0.4.jar?rev=46 并把它放到你的classpath路径下面。
第二步:简单的程序.(WordReader .java)
前提是你的E盘下有个Strust.doc文件。
import java.io.File;
import java.io.FileInputStream;
import org.textmining.text.extraction.WordExtractor;
public class WordReader {
public static String readDoc(String doc) throws Exception {
// 创建输入流读取doc文件
FileInputStream in = new FileInputStream(new File(doc));
WordExtractor extractor = null;
String text = null;
// 创建WordExtractor
extractor = new WordExtractor();
// 对doc文件进行提取
text = extractor.extractText(in);
return text;
}
/**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
try{
String text = WordReader.readDoc("E:/Strust.doc");
System.out.println(text);
}catch(Exception ex){
ex.printStackTrace();
}
}
}
这样就简单的完成了从word中读取数据了。你可以把它生成一个txt的文件。
相关文章推荐
- 用Java读取word中的数据
- 用Java简单的读取word文档中的数据
- POI实现java从Word中读取数据
- 用Java读取word中的数据
- 用Java读取word中的数据
- 用Java读取word中的数据
- Java读取大数据量07Excel的方法(POI)
- java读取txt目标文件中的数据打印到控制台
- java32.HTTP通信------使用Http的Get方式读取网络数据
- Java读取txt数据Demo
- Java读取txt文件中的数据赋给String变量方法
- java 读取文件——按照行取出(使用BufferedReader和一次将数据保存到内存两种实现方式)
- 将配置文件中的数据读取到JAVA代码中使用
- Java解析DBF文件,错误Failed to parse Number: For input string: "-.---" 或读取不出数据或乱码问题都在这里解决
- java读取word,excel和pdf文档内容
- java InputStream读取数据问题【转http://cuisuqiang.iteye.com/blog/1434416】
- java抽取word,pdf等数据
- C#调用NPOI组件读取excel表格数据转为datatable写入word表格中并向word中插入图片/文字/书签 获得书签列表
- Java从控制台中读取数据的各种方法
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法