另一些時候,我們想將一份PDF拆分成幾份分發給不同的人,或者從一份頁數很多的PDF電子書中抽取某幾頁生成單獨的PDF。
以上這些任務都涉及對PDF進行拆分。PDF無法直接編輯,該如何進行拆分呢?
今天介紹用Python進行PDF拆分,利用PyPDF2這個Python庫,可以將被拆分的PDF中的每一頁作為新的PDF導出。
PDF拆分的任務分解
Step1:利用Python讀入需要拆分的PDF
Step2:遍歷PDF文件中的每一頁,生成新的PDF對象
Step3:將生成的PDF對象導出
PDF拆分的python實現
import PyPDF2import os#將需要拆分的pdf文件放入"D:\\pdf_split\\"文件夾中,並讀入os.chdir("D:\\pdf_split\\")pdfReader = PyPDF2.PdfFileReader(open("test.pdf", 'rb'))#依次遍歷pdf文件中的每一頁,導出為新的pdffor pageNum in range(pdfReader.numPages): page = pdfReader.getPage(pageNum) pdfWriter = PyPDF2.PdfFileWriter() pdfWriter.addPage(page) filename = "第" + str(pageNum + 1) + '頁' + '.pdf' pdfOutput = open(filename, 'wb') pdfWriter.write(pdfOutput) pdfOutput.close()局限及拓展上述代碼將PDF的每一頁都單獨拆分出來。如果被拆分的PDF頁數很多,將生成很多個單獨的PDF。
如果只需要將PDF中某一頁或者某幾頁拆分出來,可以通過修改代碼實現。
參考資料Automate the Boring Stuff with Python, by Al Sweigart
福利
我們按上文思路,打包了PDF拆分器的exe文件。無需安裝python,打開PDF拆分器,點擊滑鼠即可完成PDF拆分。
PDF拆分器獲取方式:關注公眾號【拾戈】,後臺留言【PDF拆分器】,即可獲得。