概述
- 以下是 Python 中處理 Office 文檔的三個常用庫的介紹及基礎用法
- 視頻教程資料:
https://pan.quark.cn/s/a2faff7aab76
1. openpyxl(處理 Excel)
用途:專門用于讀寫 Excel 2010 及以上版本的 .xlsx
和 .xlsm
文件。
核心功能:
- 創建、修改 Excel 工作簿
- 讀取和寫入單元格數據
- 設置單元格格式(字體、顏色、邊框等)
- 操作工作表(新增、刪除、重命名)
- 處理公式、圖表等
簡單示例:
from openpyxl import Workbook# 創建工作簿
wb = Workbook()
# 獲取活動工作表
ws = wb.active
# 寫入數據
ws['A1'] = '姓名'
ws['B1'] = '年齡'
ws.append(['張三', 25])
ws.append(['李四', 30])
# 保存文件
wb.save('example.xlsx')
2. python-docx(處理 Word)
用途:用于創建和修改 Word 的 .docx
文檔(不支持舊版 .doc
)。
核心功能:
- 創建文檔、添加段落和標題
- 設置文本格式(字體、大小、加粗、斜體等)
- 插入表格、圖片、列表
- 調整頁面布局(頁邊距、紙張大小等)
- 操作頁眉頁腳
簡單示例:
from docx import Document
from docx.shared import Inches# 創建文檔
doc = Document()
# 添加標題
doc.add_heading('Python 操作 Word 示例', level=1)
# 添加段落
p = doc.add_paragraph('這是一個 ')
p.add_run('加粗的').bold = True
p.add_run(' 文本段落。')
# 添加表格
table = doc.add_table(rows=2, cols=2)
table.cell(0, 0).text = '姓名'
table.cell(0, 1).text = '職業'
table.cell(1, 0).text = '張三'
table.cell(1, 1).text = '工程師'
# 保存文件
doc.save('example.docx')
3. python-pptx(處理 PowerPoint)
用途:用于創建和修改 PowerPoint 的 .pptx
演示文稿。
核心功能:
- 創建幻燈片、設置布局
- 添加文本框、形狀、圖片
- 設置文本格式和段落樣式
- 操作幻燈片(新增、刪除、重排)
- 調整幻燈片背景、主題等
簡單示例:
from pptx import Presentation
from pptx.util import Inches, Pt# 創建演示文稿
prs = Presentation()
# 添加標題幻燈片
slide_layout = prs.slide_layouts[0]
slide = prs.slides.add_slide(slide_layout)
title = slide.shapes.title
subtitle = slide.placeholders[1]
title.text = "Python 操作 PPT 示例"
subtitle.text = "使用 python-pptx 庫"# 添加內容幻燈片
slide_layout = prs.slide_layouts[1]
slide = prs.slides.add_slide(slide_layout)
title = slide.shapes.title
content = slide.placeholders[1]
title.text = "主要功能"
tf = content.text_frame
tf.text = "1. 創建幻燈片\n2. 添加文本和圖片\n3. 設置格式"# 保存文件
prs.save('example.pptx')
共同點與注意事項:
- 均為第三方庫,需通過
pip install 庫名
安裝 - 主要支持新建和修改操作,對復雜格式的解析能力有限
- 不支持宏文件的完全編輯(如
.xlsm
中的宏代碼無法直接修改)
這些庫能有效實現辦公文檔的自動化處理,適合批量生成報告、處理數據等場景。