CSDN博客导出(三) - 将HTML转换为PDF
2014-10-29 08:27
225 查看
这一回我们该把之前生成的HTML文件转换为PDF文件了,搞了一中午还没有什么结果略坑啊
先是在网上找了将HTML转换为PDF的工具,发现itext,说是比较好用
用了之后,发现CSDN的HTML代码不是规范的,有些标签没有闭合,导致代码报错,不知道是否可以在itext中设置,忽略这个问题
然后就想把法将HTML代码转换成规范的格式,找到了JTidy,经过尝试已经可以了,
最后用规范化后的HTML去转换为PDF,结果....样子有些挫啊
。。。而且有的时候还报错。。。我看还是先试一下直接用图片转换吧。
试了转图片这东西,貌似也有问题啊,悲剧
这样的话,技术不到位啊,目前的话,估计可以这样做,在使用jsoup解析的时候,将博客内容存下来,然后按照一定的格式写到PDF中,这样就可以手动排版了
如果其他同学有什么好的想法可以分享下
----------------------------------------
先是在网上找了将HTML转换为PDF的工具,发现itext,说是比较好用
用了之后,发现CSDN的HTML代码不是规范的,有些标签没有闭合,导致代码报错,不知道是否可以在itext中设置,忽略这个问题
然后就想把法将HTML代码转换成规范的格式,找到了JTidy,经过尝试已经可以了,
最后用规范化后的HTML去转换为PDF,结果....样子有些挫啊
。。。而且有的时候还报错。。。我看还是先试一下直接用图片转换吧。
试了转图片这东西,貌似也有问题啊,悲剧
这样的话,技术不到位啊,目前的话,估计可以这样做,在使用jsoup解析的时候,将博客内容存下来,然后按照一定的格式写到PDF中,这样就可以手动排版了
如果其他同学有什么好的想法可以分享下
----------------------------------------
相关文章推荐
- CSDN博客导出(三) - 将HTML转换为PDF
- 推荐一款自己的软件作品[豆约翰博客备份专家],新浪博客,QQ空间,CSDN,cnblogs博客备份,导出CHM,PDF(转载)
- CSDN 博客导出工具, 导出PDF,html格式
- CSDN博客导出(二) - 解析HTML
- 将chm转换为html或pdf
- 推荐一款自己的免费软件作品[豆约翰博客备份专家],Cnblogs,CSDN,百度,新浪,QQ,豆瓣,搜狐,网易,天涯,51CTO,和讯,19楼博客备份,生成CHM,PDF,静态网站,离线浏览
- HTML转换成PDF工具:wkhtmltopdf
- 关于php实现html导出pdf,word格式
- 利用UIPrintPageRenderer将html转换成pdf
- Web导出(四)之iText将HTML代码导出PDF
- [置顶] 自己动手写CSDN博客提取器源码分析之三:处理网页保存为pdf文件
- DataTable导出为word,excel,html,csv,pdf,.txt
- Word/Excel/PDF文件转换成HTML整理
- JasperReport学习笔记7-导出成其它格式(pdf,xls,html)
- 借助于jasperreports与jfreechart以xls,html,pdf格式导出报表
- Word/Excel/PDF文件转换成HTML整理
- 使用Itext把html转换成pdf文件
- DataTable导出为word,excel,html,csv,pdf,.txt
- [置顶] [原创]自己动手写CSDN博客提取器,提取文件保存支持PDF、doc、txt三种格式
- iText 实现 html 转换 pdf