安裝依賴庫
在運行程序之前,請確保安裝所需的庫:
pip install pymupdf python-docx
Python 程序代碼?
import os
import fitz # PyMuPDF
from docx import Documentdef delete_pdf_first_page(input_path, output_path):"""刪除 PDF 文件的第一頁并保存:param input_path: 輸入的 PDF 文件路徑:param output_path: 輸出的 PDF 文件路徑"""# 打開 PDF 文件pdf_document = fitz.open(input_path)# 刪除第一頁pdf_document.delete_page(0)# 保存修改后的 PDFpdf_document.save(output_path)pdf_document.close()print(f"已處理并保存: {output_path}")def delete_word_first_page(input_path, output_path):"""刪除 Word 文件的第一頁內容并保存:param input_path: 輸入的 Word 文件路徑:param output_path: 輸出的 Word 文件路徑"""# 打開 Word 文件doc = Document(input_path)# 獲取第一頁的內容范圍# 假設第一頁的內容在前 500 個字符內(可以根據實際情況調整)first_page_content = doc.paragraphs[:10] # 取前 10 段作為第一頁內容# 刪除第一頁的內容for paragraph in first_page_content:p = paragraph._elementp.getparent().remove(p)# 保存修改后的 Word 文件doc.save(output_path)print(f"已處理并保存: {output_path}")def batch_process_files(folder_path, output_folder):"""批量處理文件夾中的 PDF 和 Word 文件:param folder_path: 輸入文件夾路徑:param output_folder: 輸出文件夾路徑"""# 確保輸出文件夾存在if not os.path.exists(output_folder):os.makedirs(output_folder)# 遍歷文件夾中的文件for filename in os.listdir(folder_path):file_path = os.path.join(folder_path, filename)output_path = os.path.join(output_folder, filename)try:# 處理 PDF 文件if filename.lower().endswith('.pdf'):print(f"正在處理 PDF 文件: {filename}")delete_pdf_first_page(file_path, output_path)# 處理 Word 文件elif filename.lower().endswith('.docx'):print(f"正在處理 Word 文件: {filename}")delete_word_first_page(file_path, output_path)else:print(f"跳過不支持的文件: {filename}")except Exception as e:print(f"處理文件 {filename} 時出錯: {e}")if __name__ == "__main__":# 輸入文件夾路徑(包含 PDF 和 Word 文件)input_folder = "F:\\python\\pdf" # 替換為你的輸入文件夾路徑# 輸出文件夾路徑output_folder = "F:\\python\\firstpage" # 替換為你的輸出文件夾路徑# 批量處理文件batch_process_files(input_folder, output_folder)
程序說明
-
PDF 文件處理:
-
使用?
PyMuPDF
?打開 PDF 文件,刪除第一頁并保存。 -
注意:
PyMuPDF
?的?delete_page
?方法直接刪除指定頁面。
-
-
Word 文件處理:
-
使用?
python-docx
?打開 Word 文件,刪除第一段內容(模擬刪除第一頁)。 -
注意:
python-docx
?不支持直接刪除頁面,因此通過刪除第一段內容來實現。
-
-
批量處理:
-
程序會遍歷指定文件夾中的所有文件,自動識別 PDF 和 Word 文件并處理。
-
?清華大學DeepSeek整套學習資料(持續更新)鏈接:https://pan.quark.cn/s/24136c2b13e8