PDF补丁丁(0.3.2.13测试版)新增光学字符识别(OCR)功能,将图片 PDF 文档的目录转换为书签
2011-04-25 11:17
423 查看
测试版优化了识别图片 PDF 文字的功能,并针对目录页作了优化。
![](http://pic002.cnblogs.com/images/2011/139398/2011042511100929.png)
识别目录时,将结果文件保存为文本文件,就可以用书签编辑器打开编辑,并导入 PDF 文档。
此功能减少了为图片 PDF 文档制作书签的人工输入和编辑工作量。
在选项的“识别页码范围”文本框中填入需要做字符识别的页码(如不填,则识别所有页面,请填入 PDF 文档目录页的页码范围,如12-14,表示目录页为12到14页共3页)。
根据原文档的排版特征选择适当的选项。
点击“识别图像文本”按钮开始识别。
识别后的文本结果将输出到日志界面(结果文件默认保存格式为文本格式)。
编辑输出的文本文件,修正错误识别的字符。
用书签编辑器打开该文本文件。
![](http://pic002.cnblogs.com/images/2011/139398/2011042511280652.png)
识别选项为:排版方向为“横向”、“识别目录中的点号”、“压缩连续出现的空格”,不选择“识别分栏排版”,其它为默认设置。
下图是识别上述 PDF 文档目录页后,在书签编辑器打开识别结果文件的截图。
![](http://pic002.cnblogs.com/images/2011/139398/2011042511321744.gif)
新版本的 PDF 书签编辑器增加了“补丁”按钮,无需再切换到“处理/制作 PDF 文件”就能将书签补丁到 PDF 文件。
![](http://pic002.cnblogs.com/images/2011/139398/2011042511100929.png)
识别目录时,将结果文件保存为文本文件,就可以用书签编辑器打开编辑,并导入 PDF 文档。
此功能减少了为图片 PDF 文档制作书签的人工输入和编辑工作量。
操作方式
选定原始文件,并指定输出结果保存的文件。在选项的“识别页码范围”文本框中填入需要做字符识别的页码(如不填,则识别所有页面,请填入 PDF 文档目录页的页码范围,如12-14,表示目录页为12到14页共3页)。
根据原文档的排版特征选择适当的选项。
点击“识别图像文本”按钮开始识别。
识别后的文本结果将输出到日志界面(结果文件默认保存格式为文本格式)。
编辑输出的文本文件,修正错误识别的字符。
用书签编辑器打开该文本文件。
界面截图
被识别的目录页如下(原图为1666*2400,已缩减大小)。![](http://pic002.cnblogs.com/images/2011/139398/2011042511280652.png)
识别选项为:排版方向为“横向”、“识别目录中的点号”、“压缩连续出现的空格”,不选择“识别分栏排版”,其它为默认设置。
下图是识别上述 PDF 文档目录页后,在书签编辑器打开识别结果文件的截图。
![](http://pic002.cnblogs.com/images/2011/139398/2011042511321744.gif)
新版本的 PDF 书签编辑器增加了“补丁”按钮,无需再切换到“处理/制作 PDF 文件”就能将书签补丁到 PDF 文件。
下载程序
程序的下载网址请见博客首页。相关文章推荐
- PDF补丁丁(0.3.2.1测试版)新增光学字符识别(OCR)功能,识别 PDF 文档图片的文字
- PDF 补丁丁 0.4.3.1518 测试版发布:书签编辑器新增升级书签功能、优化PDF文档阅览器
- PDF 补丁丁0.3.2版正式发布(新增PDF OCR,加强自动生成书签、书签编辑器等功能)
- PDF 补丁丁 0.4.2.1218 测试版发布:新增拆分文档功能
- PDF 补丁丁 0.4.1.804 测试版发布:合并文件夹的图片和PDF文件,自由生成多层次书签
- PDF 补丁丁 0.4.1 版:新增嵌入中文字库、替换文档字库的功能
- 利用pdfbox将pdf文档转换为图片
- 多个jpg图片怎么转换成pdf文档
- Word 导出带目录书签的PDF文档 Office
- 完整的将JPG图片转换成PDF文档
- 把PDF文档转换成为图片如何实现
- PDF 补丁丁 0.3.3.10 测试版(新增结构探查器可编辑 PDF 文档)
- 如何将Word图片转换成PDF文档
- 【使用Itext处理PDF文档(新建PDF文件、修改PDF文件、PDF中插入图片、将PDF文件转换为图片)】
- PDF文档转换后是图片格式怎么办?
- Java通过OpenOffice将word、ppt、excel、图片、txt文档转换成PDF
- 如何将图片转换成一个PDF格式文档
- PDF补丁丁0.3.3.9测试版(新增 PDF 文档结构探查器)
- 将word文档转换为图片格式的PDF
- 怎样可以把PDF文档转换成高质量的JPG图片