WORD2007转HTML
2016-05-26 11:09
169 查看
代码网上找的,但是网上只提供了代码,没有JAR包,而这个功能需要的JAR包很多,收集
起来不是太方便,我这里收集好了,点击下载。
代码如下,亲测可用:
起来不是太方便,我这里收集好了,点击下载。
代码如下,亲测可用:
package com.wei.liu.word; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.FileReader; import java.io.InputStream; import java.io.OutputStream; import org.apache.poi.xwpf.converter.core.FileImageExtractor; import org.apache.poi.xwpf.converter.core.FileURIResolver; import org.apache.poi.xwpf.converter.xhtml.XHTMLConverter; import org.apache.poi.xwpf.converter.xhtml.XHTMLOptions; import org.apache.poi.xwpf.usermodel.XWPFDocument; public class Word2007 { public static void main(String[] args) { try { File f = new File("e:\\test\\33.docx"); if (!f.exists()) { System.out.println("Sorry File does not Exists!"); } else { if (f.getName().endsWith(".docx") || f.getName().endsWith(".DOCX")) { // 1) Load DOCX into XWPFDocument InputStream in = new FileInputStream(f); XWPFDocument document = new XWPFDocument(in); // 2) Prepare XHTML options (here we set the IURIResolver to // load images from a "word/media" folder) File imageFolderFile = new File("e://test"); XHTMLOptions options = XHTMLOptions.create().URIResolver( new FileURIResolver(imageFolderFile)); options.setExtractor(new FileImageExtractor(imageFolderFile)); options.setIgnoreStylesIfUnused(false); options.setFragment(true); // 3) Convert XWPFDocument to XHTML File file = new File("e:\\test\\33.html"); OutputStream out = new FileOutputStream(file); XHTMLConverter.getInstance() .convert(document, out, options); BufferedReader in1 = new BufferedReader(new FileReader( "e:\\test\\33.html")); String str; while ((str = in1.readLine()) != null) { System.out.println(str); } in1.close(); // file.delete(); } else { System.out.println("Enter only MS Office 2007+ files"); } } } catch (Exception e) { e.printStackTrace(); } } }
相关文章推荐
- [Flex] IFrame系列 —— 嵌入本地页面两种方式source和content(html页面和html代码)
- MarkdownPad 2 在win10下出错:HTML 渲染错误(This view has crashed) 的解决办法 + MarkdownPad2.5 注册码
- 浅析 innerHTML 性能优化的原理
- innerHTML的性能问题
- html 页面太长滚动时,固定页面菜单标签,或者导航标签的位置,fixed/stickUp the position
- html中的换行符也占空间,如何解决
- C#清除HTML标签方法汇总
- HTML文档设置标记
- 手机或html中图片上传按钮不显示的解决办法!
- HTML事件默认行为与事件传播
- html图片和文字的细节
- 轻量web服务器开发日记04-buffile结构体的实现
- html基础
- html 图像映射
- XHTML标签的嵌套规则分析
- HTML获取触发事件的元素id
- [Flex] IFrame系列 —— 在flex的web应用中嵌入html的方法
- html滚动字幕代码(咋个办呢 zgbn )
- html_博客博主
- 如何选择Html.RenderPartial和Html.RenderAction