Python高手分享的九個 Word 文檔處理技巧
在日常工作中,自動化處理文檔的需求越來越普遍。Python 的 python-docx 庫提供了強大的工具來創建、讀取和修改 .docx 文件。本文將介紹如何利用 python-docx 完成一些常見的文檔處理任務。
技巧一:安裝并導入必要的庫
在開始之前,確保安裝了 python-docx 庫。這個庫能幫助我們輕松地創建、讀取和修改 .docx 文件。
pip install python-docx
然后,在你的 Python 腳本中導入它:
from docx import Document
技巧二:創建一個新的 Word 文檔
使用 Document() 函數可以創建一個新的空白文檔。
# 創建一個新文檔
doc = Document()
# 添加一段文本
doc.add_paragraph("Hello, World!")
# 保存文檔
doc.save("new_doc.docx")
運行這段代碼后,你會看到當前目錄下出現了一個名為 new_doc.docx 的文件。
技巧三:向現有文檔添加段落
如果想向一個已存在的文檔添加內容,先加載該文檔,然后添加段落。
# 加載現有文檔
doc = Document("existing_doc.docx")
# 向文檔末尾添加新段落
doc.add_paragraph("這是新增的一段話。")
# 保存更改
doc.save("existing_doc.docx")
這會打印出文檔中每一行的內容。
技巧四:讀取文檔內容
有時候我們需要從文檔中提取信息。Document 對象支持遍歷文檔中的所有段落。
doc = Document("example.docx")
for para in doc.paragraphs:
print(para.text)
技巧五:修改現有文本
假設你需要修改文檔中的某些文本,可以通過查找段落然后更新其內容。
doc = Document("example.docx")
# 假設我們知道要修改的是第一段
doc.paragraphs[0].text = "修改后的文本"
doc.save("example.docx")
技巧六:插入圖片
在報告或文檔中插入圖片非常常見。python-docx 提供了這樣的功能。
doc = Document()
# 插入圖片
doc.add_picture('image.png', width=Inches(1.25))
doc.save("with_image.docx")
這里 Inches 是一個單位轉換函數,用來指定圖片的寬度。
技巧七:設置字體樣式
除了基本的文字編輯,我們還可以調整字體大小、顏色等屬性。
doc = Document()
p = doc.add_paragraph("這是一個測試段落。")
run = p.add_run(" 這是加粗的部分。")
# 設置字體大小為 14pt,顏色為紅色
run.font.size = Pt(14)
run.font.color.rgb = RGBColor(255, 0, 0)
doc.save("styled.docx")
Pt 表示點(point),RGBColor 用于定義顏色。
技巧八:插入表格
表格在數據展示上非常有用。
doc = Document()
table = doc.add_table(rows=1, cols=3)
# 填充表格標題
hdr_cells = table.rows[0].cells
hdr_cells[0].text = '編號'
hdr_cells[1].text = '姓名'
hdr_cells[2].text = '成績'
# 添加數據行
row_cells = table.add_row().cells
row_cells[0].text = '1'
row_cells[1].text = '張三'
row_cells[2].text = '90'
doc.save("with_table.docx")
技巧九:批量替換文本
當需要在文檔中替換大量重復單詞時,手動操作顯然不是好辦法。
def replace_text_in_document(doc, old_text, new_text):
for para in doc.paragraphs:
if old_text in para.text:
inline = para.runs
# 循環遍歷段落中的每一個元素
for i in range(len(inline)):
if old_text in inline[i].text:
text = inline[i].text.replace(old_text, new_text)
inline[i].text = text
總結
通過本文的學習,我們了解了如何使用 python-docx 庫來創建新的 Word 文檔、向現有文檔添加段落、讀取文檔內容、修改現有文本、插入圖片、設置字體樣式、插入表格以及批量替換文本。這些技巧可以幫助我們更高效地處理日常工作中遇到的各種文檔任務。