手机pdf怎么拆分成多个pdf(拆分pdf文件最简单的方法)

PDF拆分的应用场景上回介绍了如何用Python进行PDF合并(传送门)。有时候,需要合并的只是几个PDF中的某几页,直接对这几个PDF进行合并将产生过多冗余页。因此,合并前最好将原有PDF进行拆分,选出需要的那几页再进行合并。

手机pdf怎么拆分成多个pdf(拆分pdf文件最简单的方法)

另一些时候,我们想将一份PDF拆分成几份分发给不同的人,或者从一份页数很多的PDF电子书中抽取某几页生成单独的PDF。

今天介绍用Python进行PDF拆分,利用PyPDF2这个Python库,可以将被拆分的PDF中的每一页作为新的PDF导出。

PDF拆分的任务分解

Step1:利用Python读入需要拆分的PDF

Step2:遍历PDF文件中的每一页,生成新的PDF对象

Step3:将生成的PDF对象导出

PDF拆分的python实现

importPyPDF2import os#将需要拆分的pdf文件放入”D:\\pdf_split\\”文件夹中,并读入os.chdir(“D:\\pdf_split\\”)pdfReader = PyPDF2.PdfFileReader(open(“test.pdf”, ‘rb’))#依次遍历pdf文件中的每一页,导出为新的pdffor pageNum in range(pdfReader.numPages): page = pdfReader.getPage(pageNum) pdfWriter = PyPDF2.PdfFileWriter() pdfWriter.addPage(page) filename = “第” str(pageNum 1) ‘页’ ‘.pdf’ pdfOutput = open(filename, ‘wb’) pdfWriter.write(pdfOutput) pdfOutput.close()局限及拓展

上述代码将PDF的每一页都单独拆分出来。如果被拆分的PDF页数很多,将生成很多个单独的PDF。

如果只需要将PDF中某一页或者某几页拆分出来,可以通过修改代码实现。

参考资料

Automate the Boring Stuff with Python,byAl Sweigart

福利

发表评论

登录后才能评论