python將pdf文件轉為圖片,如果pdf文件包含多頁,將轉化的多個圖片通過垂直或者水平合并成一張圖片

要將PDF文件轉換為圖片,并將多頁PDF垂直合并成一張圖片,可以使用PyMuPDF(也稱為fitz)庫來讀取PDF文件,并使用Pillow庫來處理和合并圖片。以下是一個示例代碼,展示了如何實現這個功能:

首先,確保已經安裝了所需的庫。可以使用以下命令來安裝它們:

pip install PyMuPDF Pillow

然后,可以使用以下Python代碼來實現PDF到圖片的轉換以及圖片的垂直或者水平合并:

import fitz  # PyMuPDF
from PIL import Imagedef pdf_to_img_list(pdf_path):# 打開PDF文件pdf_document = fitz.open(pdf_path)images_list = []# 遍歷PDF的每一頁for page_num in range(len(pdf_document)):page = pdf_document.load_page(page_num)  # 加載頁面pix = page.get_pixmap(matrix=fitz.Matrix(2, 2), alpha=False)   # 將頁面轉換為圖片img = Image.frombytes("RGB", [pix.width, pix.height], pix.samples)images_list.append(img)return images_list"""垂直合并"""
def merge_images_vertically(images, output_path):# 獲取每張圖片的寬度和高度widths, heights = zip(*(i.size for i in images))# 計算合并后的圖片寬度(取最寬的圖片寬度)和總高度total_width = max(widths)total_height = sum(heights)# 創建一個新的空白圖片,用于存放合并后的圖片new_image = Image.new('RGB', (total_width, total_height))# 將每張圖片按順序粘貼到新的圖片上y_offset = 0for img in images:new_image.paste(img, (0, y_offset))y_offset += img.height# 保存合并后的圖片new_image.save(output_path)"""水平合并"""
def merge_images_horizontally(images,output_path):# 計算合并后的圖像寬度和高度widths, heights = zip(*(i.size for i in images))total_width = sum(widths)max_height = max(heights)# 創建一個新的空白圖像,用于存放合并后的圖像new_image = Image.new('RGB', (total_width, max_height))x_offset = 0for img in images:new_image.paste(img, (x_offset, 0))x_offset += img.widthnew_image.save(output_path)"""調用方法,進行合并"""
def pdf_to_image(pdf_path, output_path):# pdf轉圖片images = pdf_to_img_list(pdf_path)# 垂直合并merge_images_vertically(images, output_path)# 水平合并merge_images_horizontally(images, output_path)# 使用示例
pdf_file = 'example.pdf'  # 替換為你的PDF文件路徑
output_image = 'output_image.jpg'  # 替換為你想要保存的圖片路徑pdf_to_image(pdf_file, output_image)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/76626.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/76626.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/76626.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

HarmonyOS 基礎組件和基礎布局的介紹

1. HarmonyOS 基礎組件 1.1 Text 文本組件 Text(this.message)//文本內容.width(200).height(50).margin({ top: 20, left: 20 }).fontSize(30)//字體大小.maxLines(1)// 最大行數.textOverflow({ overflow: TextOverflow.Ellipsis })// 超出顯示....fontColor(Color.Black).…

FrameWork基礎案例解析(四)

文章目錄 單獨拉取framework開機與開機動畫橫屏Android.mk語法單獨編譯SDKmake 忽略warning單獨修改和編譯Camera2單獨編譯Launcher3Android Studio 導入、修改、編譯Settings導入 Android Studio 導入、修改、編譯Launcher3android 開機默認進入指定Launcher植入自己的apk到系…

基于vscode(GDB)調試ros2節點

一、環境準備 必備vscode插件 1)Docker Docker - Visual Studio Marketplace 2)Dev Containers Dev Containers - Visual Studio Marketplace 3)GDB GDB Debug - Visual Studio Marketplace 二、進去docker鏡像 1)docker安…

基于springboot的考研成績查詢系統(源碼+lw+部署文檔+講解),源碼可白嫖!

摘要 這些年隨著Internet的迅速發展,我們國家和世界都已經進入了互聯網大數據時代,計算機網絡已經成為了整個社會以及經濟發展的巨大動能,考研成績查詢管理事務現在已經成為社會關注的重要內容,因此運用互聯網技術來提高考研成績…

C++:算術運算符

程序員Amin 🙈作者簡介:練習時長兩年半,全棧up主 🙉個人主頁:程序員Amin 🙊 P? ?S : 點贊是免費的,卻可以讓寫博客的作者開心好久好久😎 📚系列專欄:Java全…

PyQt6實例_A股日數據維護工具_使用

目錄 前置: 下載預備更新的數據 使用工具更新 用工具下載未復權、前復權、權息數據 在PostgreSQL添加兩個數據表 工具&視頻 前置: 1 本系列將以 “PyQt6實例_A股日數據維護工具” 開頭放置在“PyQt6實例”專欄 2 日數據可在“數據庫”專欄&…

REST 方法

FUNCTION ZFM_INTERFACE_LOG. *"---------------------------------------------------------------------- *"*"本地接口: *" IMPORTING *" REFERENCE(IV_DSTART) TYPE EDI_UPDDAT *"---------------------------------------…

QT 中的元對象系統(五):QMetaObject::invokeMethod的使用和實現原理

目錄 1.簡介 2.原理概述 3.實現分析 3.1.通過方法名調用方法的實現分析 3.2.通過可調用對象調用方法的實現分析 4.使用場景 5.總結 1.簡介 QMetaObject::invokeMethod 是 Qt 框架中的一個靜態方法,用于在運行時調用對象的成員函數。這個方法提供了一種動態調…

Unity3D開發AI桌面精靈/寵物系列 【三】 語音識別 ASR 技術、語音轉文本多平臺 - 支持科大訊飛、百度等 C# 開發

Unity3D 交互式AI桌面寵物開發系列【三】ASR 語音識別 該系列主要介紹怎么制作AI桌面寵物的流程,我會從項目開始創建初期到最終可以和AI寵物進行交互為止,項目已經開發完成,我會仔細梳理一下流程,分步講解。 這篇文章主要講有關于…

Java 狀態模式 詳解

狀態模式詳解 一、狀態模式概述 狀態模式(State Pattern)是一種行為型設計模式,它允許一個對象在其內部狀態改變時改變它的行為,使對象看起來似乎修改了它的類。 核心特點 狀態封裝:將每個狀態的行為封裝到獨立的類中狀態轉換&#xff1a…

Nginx 配置 HTTPS 與 WSS 完整指南

Nginx 配置 HTTPS 與 WSS 完整指南 本教程將手把手教你如何為網站配置 HTTPS 加密訪問,并通過反向代理實現安全的 WebSocket(WSS)通信。以 https://www.zhegepai.cn 域名為例,完整流程約需 30 分鐘完成。 一、前置準備 1.1 域名…

雙向鏈表的理解

背景 代碼中經常會出現雙向鏈表,對于雙向鏈表的插入和刪除有對應的API函數接口,但直觀的圖表更容易理解,所以本文會對rt-thread內核代碼中提供的雙向鏈表的一些API函數操作進行繪圖,方便后續隨時查看。 代碼塊 rt-thread中提供…

大文件上傳源碼,支持單個大文件與多個大文件

大文件上傳源碼,支持單個大文件與多個大文件 Ⅰ 思路Ⅱ 具體代碼前端--單個大文件前端--多個大文件前端接口后端 Ⅰ 思路 具體思路請參考我之前的文章,這里分享的是上傳流程與源碼 https://blog.csdn.net/sugerfle/article/details/130829022 Ⅱ 具體代碼…

Unity中的靜態合批使用整理

靜態批處理是一種繪制調用批處理方法,它組合不移動的網格以減少繪制調用。它將組合的網格轉換為世界空間,并為它們構建一個共享頂點和索引緩沖區。然后,對于可見網格,Unity 會執行一系列簡單的繪制調用,每個調用之間幾…

【機器學習中的基本術語:特征、樣本、訓練集、測試集、監督/無監督學習】

機器學習基本術語詳解 1. 特征(Feature) 定義:數據的屬性或變量,用于描述樣本的某個方面。作用:模型通過學習特征與目標之間的關系進行預測。示例: 預測房價時,特征可以是 面積、地段、房齡。…

C++學習之路:指針基礎

目錄 指針介紹與基本用法雙重指針函數指針空指針與野指針函數參數的指針傳遞最后 指針一般在C/C語言學習的后期接觸,這樣就導致指針給新手一種高深莫測、難以掌握的刻板印象。但實際上指針的使用很簡單,并且還能夠極大的提高程序的靈活性,幫助…

【服務日志鏈路追蹤】

MDCInheritableThreadLocal和spring cloud sleuth 在微服務架構中,日志鏈路追蹤(Logback Distributed Tracing) 是一個關鍵需求,主要用于跟蹤請求在不同服務間的調用鏈路,便于排查問題。常見的實現方案有兩種&#x…

Kafka+Zookeeper從docker部署到spring boot使用完整教程

文章目錄 一、Kafka1.Kafka核心介紹:?核心架構?核心特性?典型應用 2.Kafka對 ZooKeeper 的依賴:3.去 ZooKeeper 的演進之路:注:(本文采用ZooKeeper3.8 Kafka2.8.1) 二、Zookeeper1.核心架構與特性2.典型…

JUC系列JMM學習之隨筆

JUC: JUC 是 Java 并發編程的核心工具包,全稱為 Java Util Concurrent,是 java.util.concurrent 包及其子包的簡稱。它提供了一套強大且高效的并發編程工具,用于簡化多線程開發并提高性能。 CPU核心數和線程數的關系:1核處理1線程(同一時間單次) CPU內核結構: 工作內…

The Rust Programming Language 學習 (九)

泛型 每一個編程語言都有高效處理重復概念的工具。在 Rust 中其工具之一就是 泛型(generics)。泛型是具體類型或其他屬性的抽象替代。我們可以表達泛型的屬性,比如他們的行為或如何與其他泛型相關聯,而不需要在編寫和編譯代碼時知…