您的位置:首页 > Web前端 > HTML

CSDN博客导出(三) - 将HTML转换为PDF

2014-10-29 08:27 225 查看
这一回我们该把之前生成的HTML文件转换为PDF文件了,搞了一中午还没有什么结果略坑啊

先是在网上找了将HTML转换为PDF的工具,发现itext,说是比较好用

用了之后,发现CSDN的HTML代码不是规范的,有些标签没有闭合,导致代码报错,不知道是否可以在itext中设置,忽略这个问题

然后就想把法将HTML代码转换成规范的格式,找到了JTidy,经过尝试已经可以了,

最后用规范化后的HTML去转换为PDF,结果....样子有些挫啊

。。。而且有的时候还报错。。。我看还是先试一下直接用图片转换吧。


试了转图片这东西,貌似也有问题啊,悲剧

这样的话,技术不到位啊,目前的话,估计可以这样做,在使用jsoup解析的时候,将博客内容存下来,然后按照一定的格式写到PDF中,这样就可以手动排版了

如果其他同学有什么好的想法可以分享下

----------------------------------------
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: