[Python]:关于截取pdf中的某些页
2017-03-03 11:14
423 查看
PyPDF2
python对于处理一些日常繁琐事物来说是很便捷的,比如今天我们要说的pdf操作。需求如题,想从一个pdf文件中截取出指定的页面。我用的工具是py2pdf。
首先,我们需要读取待处理pdf文件。
import PyPDF2 as pdf inputfile = "/path/to/your/pdf/file" outputfile = "/path/to/your/new/pdf/file" reader = pdf.PdfFileReader(inputfile) pages = [num1, num2, num3, ..., numn] getpages = list() for i in pages: page = reader.getPage(i-1) #page number starts with 0 getpages.append(page)
到此,所需要的页面都已经读取出来并存放在
getpages中。下一步就是将读取出来的页面按顺序写进指定的PDF文件中。
writer = pdf.PdfFileWriter() for page in getpages: writer.addPage(page) with open(outputfile,'a+') as fh: writer.write(fh)
大功告成!
相关文章推荐
- 关于某些网站不能使用Adobe PDF Reader下载PDF文件的问题解决方案
- 关于python元组数据截取问题的记录
- 关于ipad阅读某些pdf文件出现乱码的简单解决办法
- 有关于剑指offer中某些题的python实现
- 关于截取超长字符串的办法
- 关于在组件GIS开发中使用Python的一点补充说明
- iTextSharp应用中关于“Cannot access a closed Stream”问题的解决办法(附带提供如何在页面中显示PDF的流)
- 关于python的观点
- 关于squid禁止某些站点的访问的控制 (acl语句)
- python中使用状态机的简单例子---截取'/x00'之前的字符串
- python中关于文件路径的简单操作
- 关于Python中时间与字符串直接的转换...
- 关于用python的SQLAlchemy访问数据库的学习记录,及SQLAlchemy的安装简介
- 【EXLIBRIS】关于我现有的大部分PDF书目以及共享
- 发现Python的源代码中关于字符串fastsearch算法的一个笔误!
- 关于显示某些html标记符号的问题
- 关于Python的线程
- 关于某些用户恶意利用Blog功能的公告
- 关于Python的super用法研究(zt)
- 关于某些思维的逻辑