靈感來源于博主正在學408,在搞到視頻課對應的ppt.pdf后發現pdf是按小節的,以至于每章有5-10甚至更多,這可太繁瑣了,我想要一章一個pdf就可以了,于是淺淺查了幾個CSDN發現使用python的要么收費要么要vip,不用py的就是用在線的網站集成的功能,你知道的要充值才能用。算了還是自己搞吧。
由于博主的目標資源是ppt結成圖片形成的pdf,也就是要合并的那些pdf文件的內容啊都是圖片形式的,不包含字符,大家區分借鑒。
代碼如下:
from PyPDF2 import PdfMerger
import osdef merge_pdfs_with_pypdf2(input_folder, output_file):merger = PdfMerger()# 獲取文件夾中所有PDF文件pdf_files = [f for f in os.listdir(input_folder) if f.endswith('.pdf')]pdf_files.sort() # 按文件名排序for pdf in pdf_files:file_path = os.path.join(input_folder, pdf)merger.append(file_path)# 輸出合并后的PDFmerger.write(output_file)merger.close()print(f"PDFs合并完成,輸出文件: {output_file}")# 使用示例
merge_pdfs_with_pypdf2(r'存放pdfs的文件夾路徑', "最終輸出合并后結果的pdf文件路徑/merged.pdf")
注意默認按照文件名的排序進行合并,如有其它想法的可以提前手動編號。