Python辦公神器：教你如何快速分拆、刪頁、合并PDF文件

作者：了不起 2023-11-22 19:07:51

在這篇教程中，我們將學(xué)習(xí)如何使用PyPDF2庫來快速分拆、刪頁、合并PDF文件。我們將通過一些實(shí)際的例子來演示這些操作，并介紹一些常用的API和參數(shù)。

哈嘍大家好，我是了不起，今天教你如何用Python快速分拆、刪頁、合并PDF文件。

介紹

有時(shí)我們可能需要對(duì)PDF文件進(jìn)行一些處理，例如分拆、刪頁、合并等。這些操作在一些專業(yè)的PDF軟件中可能比較容易實(shí)現(xiàn)，但是如果我們想要用Python來自動(dòng)化或批量處理這些操作呢?有沒有什么簡單而強(qiáng)大的Python庫可以幫助我們呢?

答案是肯定的。在Python中，有一個(gè)叫做PyPDF2的庫，它可以讓我們用簡單的代碼來處理PDF文件。

在這篇教程中，我們將學(xué)習(xí)如何使用PyPDF2庫來快速分拆、刪頁、合并PDF文件。我們將通過一些實(shí)際的例子來演示這些操作，并介紹一些常用的API和參數(shù)。在開始之前，我們需要先安裝PyPDF2庫。

安裝要安裝PyPDF2庫，我們可以使用pip命令：

pip install PyPDF2

安裝完成后，我們就可以在Python中導(dǎo)入PyPDF2庫了：

import PyPDF2

分拆

分拆(Split)是指將一個(gè)PDF文件分成多個(gè)小的PDF文件，每個(gè)小文件只包含原文件中的一部分頁面。這樣做的目的可能是為了方便管理或傳輸這些文件，或者只需要其中的某些頁面。

要實(shí)現(xiàn)分拆操作，我們需要使用PyPDF2.PdfReader類來讀取原始的PDF文件，并使用PyPDF2.PdfWriter類來創(chuàng)建新的PDF文件，并將需要的頁面寫入其中。下面是一個(gè)簡單的例子：

# 讀取原始的PDF文件
pdf_reader = PyPDF2.PdfReader("original.pdf")

# 獲取原始文件中的總頁數(shù)
total_pages = len(pdf_reader.pages)

# 創(chuàng)建一個(gè)空列表，用于存放新創(chuàng)建的PDF文件名
new_files = []

# 循環(huán)遍歷每一頁
for i in range(total_pages):
    # 創(chuàng)建一個(gè)新的PdfFileWriter對(duì)象
    pdf_writer = PyPDF2.PdfWriter()
    # 獲取當(dāng)前頁對(duì)象
    page = pdf_reader.pages[i]
    # 將當(dāng)前頁對(duì)象添加到PdfFileWriter對(duì)象中
    pdf_writer.add_page(page)
    # 創(chuàng)建一個(gè)新的PDF文件名，格式為"original_頁碼.pdf"
    new_file = f"original_{i+1}.pdf"
    # 將新的PDF文件名添加到列表中
    new_files.append(new_file)
    # 打開一個(gè)新的PDF文件，以二進(jìn)制寫入模式
    with open(new_file, "wb") as f:
        # 將PdfFileWriter對(duì)象中的內(nèi)容寫入到新的PDF文件中
        pdf_writer.write(f)

# 打印出新創(chuàng)建的PDF文件名
print(new_files)

運(yùn)行上面的代碼，我們可以得到如下的輸出：

['original_1.pdf', 'original_2.pdf', 'original_3.pdf', 'original_4.pdf', 'original_5.pdf']

這說明我們已經(jīng)成功地將原始的PDF文件分拆成了5個(gè)小的PDF文件，每個(gè)文件只包含原始文件中的一頁。我們可以打開這些文件，查看它們的內(nèi)容是否正確。

刪頁

刪頁(Delete)是指將一個(gè)PDF文件中的某些頁面刪除，只保留需要的頁面。這樣做的目的可能是為了減少文件的大小或去除不相關(guān)的內(nèi)容。

要實(shí)現(xiàn)刪頁操作，我們也需要使用PyPDF2.PdfReader類來讀取原始的PDF文件，并使用PyPDF2.PdfWriter類來創(chuàng)建新的PDF文件，并將需要保留的頁面寫入其中。不同的是，我們需要指定要?jiǎng)h除的頁面的索引或范圍，并在循環(huán)遍歷每一頁時(shí)跳過這些頁面。下面是一個(gè)簡單的例子：

# 讀取原始的PDF文件
pdf_reader = PyPDF2.PdfReader("original.pdf")

# 獲取原始文件中的總頁數(shù)
total_pages = len(pdf_reader.pages)

# 指定要?jiǎng)h除的頁面索引或范圍，從0開始計(jì)數(shù)
delete_pages = [0, 2, 4]

# 創(chuàng)建一個(gè)新的PdfFileWriter對(duì)象
pdf_writer = PyPDF2.PdfWriter()

# 循環(huán)遍歷每一頁
for i in range(total_pages):
    # 如果當(dāng)前頁索引不在要?jiǎng)h除的頁面列表中，則保留該頁
    if i not in delete_pages:
        # 獲取當(dāng)前頁對(duì)象
        page = pdf_reader.pages[i]
        # 將當(dāng)前頁對(duì)象添加到PdfFileWriter對(duì)象中
        pdf_writer.add_page(page)

# 創(chuàng)建一個(gè)新的PDF文件名，格式為"original_deleted.pdf"
new_file = "original_deleted.pdf"

# 打開一個(gè)新的PDF文件，以二進(jìn)制寫入模式
with open(new_file, "wb") as f:
    # 將PdfFileWriter對(duì)象中的內(nèi)容寫入到新的PDF文件中
    pdf_writer.write(f)

# 打印出新創(chuàng)建的PDF文件名
print(new_file)

運(yùn)行上面的代碼，我們可以得到如下的輸出：

original_deleted.pdf

這說明我們已經(jīng)成功地將原始的PDF文件中的第1、3、5頁刪除，只保留了第2、4頁。我們可以打開新創(chuàng)建的PDF文件，查看它們的內(nèi)容是否正確。

合并

合并(Merge)是指將多個(gè)PDF文件合并成一個(gè)大的PDF文件，包含所有原始文件中的所有頁面。這樣做的目的可能是為了整合或匯總相關(guān)的文檔，或者方便查閱或打印。

要實(shí)現(xiàn)合并操作，我們需要使用PyPDF2.PdfMerger類來創(chuàng)建一個(gè)合并器對(duì)象，并使用它來添加和合并多個(gè)PDF文件。下面是一個(gè)簡單的例子：

# 創(chuàng)建一個(gè)PdfMerger對(duì)象
pdf_merger = PyPDF2.PdfMerger()

# 創(chuàng)建一個(gè)空列表，用于存放要合并的PDF文件名
files_to_merge = []

# 循環(huán)遍歷要合并的5個(gè)小文件
for i in range(5):
    # 獲取當(dāng)前小文件名，格式為"original_頁碼.pdf"
    file = f"original_{i+1}.pdf"
    # 將當(dāng)前小文件名添加到列表中
    files_to_merge.append(file)
    # 用PdfFileReader對(duì)象打開當(dāng)前小文件
    pdf_reader = PyPDF2.PdfReader(file)
    # 用PdfFileMerger對(duì)象添加當(dāng)前小文件，append方法可以將所有頁面添加到合并器中
    pdf_merger.append(pdf_reader)

# 創(chuàng)建一個(gè)新的PDF文件名，格式為"original_merged.pdf"
new_file = "original_merged.pdf"

# 打開一個(gè)新的PDF文件，以二進(jìn)制寫入模式
with open(new_file, "wb") as f:
    # 將PdfFileMerger對(duì)象中的內(nèi)容寫入到新的PDF文件中
    pdf_merger.write(f)

# 打印出新創(chuàng)建的PDF文件名
print(new_file)

運(yùn)行上面的代碼，我們可以得到如下的輸出：

original_merged.pdf

這說明我們已經(jīng)成功地將5個(gè)小的PDF文件合并成了一個(gè)大的PDF文件，包含了原始文件中的所有頁面。我們可以打開新創(chuàng)建的PDF文件，查看它們的內(nèi)容是否正確。

總結(jié)

在這篇教程中，我們學(xué)習(xí)了如何使用PyPDF2庫來快速分拆、刪頁、合并PDF文件。我們通過一些實(shí)際的例子來演示了這些操作，并介紹了一些常用的API和參數(shù)。PyPDF2庫還有很多其他的功能和特性，例如旋轉(zhuǎn)、裁剪、加密、解密、提取文本等，感興趣的讀者可以自行探索和嘗試。希望這篇教程對(duì)你有所幫助，讓你成為Python自動(dòng)化辦公高手!

責(zé)任編輯：趙寧寧來源： Python都知道