您的位置:首页 > 编程语言 > Python开发

[Python]:关于截取pdf中的某些页

2017-03-03 11:14 423 查看

PyPDF2

python对于处理一些日常繁琐事物来说是很便捷的,比如今天我们要说的pdf操作。

需求如题,想从一个pdf文件中截取出指定的页面。我用的工具是py2pdf。

首先,我们需要读取待处理pdf文件。

import PyPDF2 as pdf

inputfile = "/path/to/your/pdf/file"
outputfile = "/path/to/your/new/pdf/file"
reader = pdf.PdfFileReader(inputfile)
pages = [num1, num2, num3, ..., numn]
getpages = list()

for i in pages:
page = reader.getPage(i-1) #page number starts with 0
getpages.append(page)


到此,所需要的页面都已经读取出来并存放在
getpages
中。下一步就是将读取出来的页面按顺序写进指定的PDF文件中。

writer = pdf.PdfFileWriter()
for page in getpages:
writer.addPage(page)
with open(outputfile,'a+') as fh:
writer.write(fh)


大功告成!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  python pdf