PDF轉換工具xpdf-tools-4.05

? ? ? XPDF是一個開源的PDF查看、提取和轉換工具套件,使用C++編寫,支持多種操作系統,包括Linux、Unix、OS/2、Windows和Mac OS X?1。XPDF不僅是一個PDF查看器,還包含多個實用工具,如文本提取器、圖像轉換器和HTML轉換器等?,內置工具包含pdftohtml、pdftotext、pdftopng、pdftops等,支持命令行調用,可實現自主開發程序的自動化。

? ? ? 下面以pdftotext為例,介紹一下將PDF轉換為TXT的用法:

一、命令的規則

pdftotext version 4.05 [www.xpdfreader.com]
Copyright 1996-2024 Glyph & Cog, LLC
Usage: pdftotext [options] <PDF-file> [<text-file>]
? -f <int> ? ? ? ? ? ? ? : first page to convert
? -l <int> ? ? ? ? ? ? ? : last page to convert
? -layout ? ? ? ? ? ? ? ?: maintain original physical layout
? -simple ? ? ? ? ? ? ? ?: simple one-column page layout
? -simple2 ? ? ? ? ? ? ? : simple one-column page layout, version 2
? -table ? ? ? ? ? ? ? ? : similar to -layout, but optimized for tables
? -lineprinter ? ? ? ? ? : use strict fixed-pitch/height layout
? -raw ? ? ? ? ? ? ? ? ? : keep strings in content stream order
? -fixed <number> ? ? ? ?: assume fixed-pitch (or tabular) text
? -linespacing <number> ?: fixed line spacing for LinePrinter mode
? -clip ? ? ? ? ? ? ? ? ?: separate clipped text
? -nodiag ? ? ? ? ? ? ? ?: discard diagonal text
? -enc <string> ? ? ? ? ?: output text encoding name
? -eol <string> ? ? ? ? ?: output end-of-line convention (unix, dos, or mac)
? -nopgbrk ? ? ? ? ? ? ? : don't insert a page break at the end of each page
? -bom ? ? ? ? ? ? ? ? ? : insert a Unicode BOM at the start of the text file
? -marginl <number> ? ? ?: left page margin
? -marginr <number> ? ? ?: right page margin
? -margint <number> ? ? ?: top page margin
? -marginb <number> ? ? ?: bottom page margin
? -opw <string> ? ? ? ? ?: owner password (for encrypted files)
? -upw <string> ? ? ? ? ?: user password (for encrypted files)
? -verbose ? ? ? ? ? ? ? : print per-page status information
? -q ? ? ? ? ? ? ? ? ? ? : don't print any messages or errors
? -cfg <string> ? ? ? ? ?: configuration file to use in place of .xpdfrc
? -listencodings ? ? ? ? : list all available output text encodings
? -v ? ? ? ? ? ? ? ? ? ? : print copyright and version info
? -h ? ? ? ? ? ? ? ? ? ? : print usage information
? -help ? ? ? ? ? ? ? ? ?: print usage information
? --help ? ? ? ? ? ? ? ? : print usage information
? -? ? ? ? ? ? ? ? ? ? ? : print usage information

二、參數解釋

-layout 選項可以保持原始PDF的布局信息。
-enc UTF-8 指定輸出文件的編碼為UTF-8。?
-f <num> : 指定要轉換的起始頁碼。
-l <num> : 指定要轉換的結束頁碼。
-enc <encoding> : 指定輸出文件的編碼格式,常用的有UTF-8等。

三、應用實例

1. 轉換PDF為TXT文檔。

pdftotxt.exe <input.pdf> [<output.txt>]

其中 <input.pdf> 是源PDF文件的路徑, <output.txt> 是輸出的文本文件路徑(可選)。

2. 如果PDF包含中文,轉換時需指定輸出文件的編碼格式。

pdftotext -enc UTF-8 input.pdf output.txt

3. 如果需要保持原始PDF的布局,可以加上-layout 選項。

pdftotext -layout -enc UTF-8 input.pdf output.txt

4. 指定轉換頁碼的范圍。

pdftotxt.exe -layout -enc UTF-8 -f 1 -l 2 input.pdf?output.txt

將 input.pdf 的第1頁和第2頁轉換為output.txt。

四、下載地址

PDF轉換工具xpdf-tools-win-4.05

PDF轉換工具xpdf-tools-linux-4.05

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/79671.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/79671.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/79671.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Vivado FPGA 開發 | 創建工程 / 仿真 / 燒錄

注&#xff1a;本文為 “Vivado FPGA 開發 | 創建工程 / 仿真 / 燒錄” 相關文章合輯。 略作重排&#xff0c;未整理去重。 如有內容異常&#xff0c;請看原文。 Vivado 開發流程&#xff08;手把手教學實例&#xff09;&#xff08;FPGA&#xff09; 不完美先生 于 2018-04-…

【PINN】DeepXDE學習訓練營(13)——operator-antiderivative_aligned.py

一、引言 隨著人工智能技術的飛速發展&#xff0c;深度學習在圖像識別、自然語言處理等領域的應用屢見不鮮&#xff0c;但在科學計算、工程模擬以及物理建模方面&#xff0c;傳統的數值方法仍然占據主導地位。偏微分方程&#xff08;Partial Differential Equations, PDEs&…

NPP庫中libnppc模塊介紹

1. libnppc 模塊簡介 libnppc 是 NVIDIA Performance Primitives (NPP) 的 核心基礎模塊,提供跨模塊的通用數據類型、內存管理和基礎運算功能,不直接實現圖像或信號處理算法,而是為其他模塊(如 libnppi、libnpps)提供支持。 主要功能包括: 基礎數據類型定義(如 Npp8u、…

#基于PCL的多平面分割系統技術文檔

多平面分割系統技術文檔 一、數據結構定義 /*** @brief 平面分割結果結構體* @param coefficients 平面方程系數(ax+by+cz+d=0)* @param cloud 屬于該平面的點云子集* @param centroid 平面質心坐標(齊次坐標)* @param plane_id 平面編號(主平面為1)*/ struct PlaneSegmentRes…

PyTorch_張量拼接

張量的拼接操作在神經網絡搭建過程中是非常常用的方法&#xff0c;例如&#xff1a;殘差網絡&#xff0c;注意力機制中都使用張量拼接。 torch.cat 函數的使用 可以將兩個張量根據指定的維度拼接起來。 import torch import numpy as np def test01():data1 torch.randint(…

【SQL觸發器、事務、鎖的概念和應用】

【SQL觸發器、事務、鎖的概念和應用】 1.觸發器 (一)觸發器概述 1.觸發器的定義 觸發器(Trigger)是一種特殊的存儲過程,它與表緊密相連,可以是表定義的一部分。當預定義的事件(如用戶修改指定表或者視圖中的數據)發生時,觸發器會自動執行。 觸發器基于一個表創建,…

設計模式每日硬核訓練 Day 17:中介者模式(Mediator Pattern)完整講解與實戰應用

&#x1f504; 回顧 Day 16&#xff1a;責任鏈模式小結 在 Day 16 中&#xff0c;我們學習了責任鏈模式&#xff08;Chain of Responsibility Pattern&#xff09;&#xff1a; 將請求沿鏈傳遞&#xff0c;節點可選擇處理或傳遞下一節點。實現了請求發送者與多個處理者的解耦…

如何提升個人情商?

引言 提升個人情商&#xff08;EQ&#xff09;是一個持續的自我修煉過程&#xff0c;涉及自我認知、情緒管理、人際溝通等多個方面。以下是一些具體且可實踐的方法&#xff0c;幫助你逐步提升情商&#xff1a; 一、提升自我覺察能力 1. 記錄情緒日記 每天回顧自己的情緒…

STM32Cube-FreeRTOS任務調度與任務管理-筆記

STM32Cube-FreeRTOS任務調度與任務管理-筆記 一、任務調度機制1.1 調度算法類型 二、搶占式調度實現與分析2.1 時間片輪轉機制2.2 調度觸發條件2.3 搶占式調度例子 三、合作式調度實現3.1 核心邏輯3.1 合作式調度例子 四、任務管理函數詳解4.1 任務創建4.1.1 動態創建任務4.1.2…

對稱加密算法(AES、ChaCha20和SM4)Python實現——密碼學基礎(Python出現No module named “Crypto” 解決方案)

文章目錄 一、對稱加密算法基礎1.1 對稱加密算法的基本原理1.2 對稱加密的主要工作模式 二、AES加密算法詳解2.1 AES基本介紹2.2 AES加密過程2.3 Python中實現AES加密Python出現No module named “Crypto” 解決方案 2.4 AES的安全考量 三、ChaCha20加密算法3.1 ChaCha20基本介…

MATLAB圖像加密案例

下面是一個使用 MATLAB 編寫的簡單圖像塊置亂加密/解密程序,主要利用了函數來組織代碼。 這個程序通過將圖像分割成小塊,然后根據一個密鑰(用于隨機數生成器種子)打亂這些塊的順序來實現加密。解密過程則使用相同的密鑰恢復原始塊順序。 核心思想: 分塊: 將圖像劃分為 …

阿里云服務器全棧技術指導手冊(2025版)

阿里云服務器全棧技術指導手冊&#xff08;2025版&#xff09; 一、基礎配置與核心架構設計 1. 精準實例選型策略 ? 通用計算場景&#xff1a;選擇ECS通用型&#xff08;如ecs.g7&#xff09;實例&#xff0c;搭載第三代Intel Xeon處理器&#xff0c;適合Web應用、中小型數…

word批量轉pdf工具

word批量轉pdf工具 圖片 說到了辦公&#xff0c;怎能不提PDF轉換哦&#xff1f; 這是一款一鍵就可以批量word轉換為PDF的小工具&#xff0c;簡直是VB界的一股清流。 圖片 操作簡單到不行&#xff0c;只要把需要轉換的word文件和這個工具放在同一個文件夾里&#xff0c;雙擊…

C++類_協變返回類型

協變返回類型定義 在 C11 中&#xff0c;協變返回類型是指在基類和派生類的虛函數重寫時&#xff0c;派生類中重寫的虛函數的返回類型可以是基類中對應虛函數返回類型的派生類型。也就是說&#xff0c;當基類的虛函數返回一個基類指針或引用時&#xff0c;派生類中重寫該虛函數…

補充:建立實體類與數據表的映射關系

目錄 前言 1 成員變量數據類型和字段類型 保持對應 2 成員變量的變量名&#xff0c;應采用小駝峰命名法 3 數據表中的主鍵如id 應采用自增方式 4 數據表中的時間類型數據與實體類中的時間類型的變量無法實現自動映射可以使用JsonFormat 注解 4.1 配置全局時間處理器&#x…

HTML/CSS 魔法第二彈:會逃跑的調皮按鈕(懸停自動閃避)

引言 在網頁設計中&#xff0c;交互性是吸引用戶的關鍵因素之一。普通的按鈕在用戶懸停時可能只是顏色或樣式發生改變&#xff0c;但今天我們要創造一個 “調皮” 的按鈕&#xff0c;當用戶鼠標懸停在上面時&#xff0c;它會自動閃避&#xff0c;仿佛在和用戶玩游戲。本文將詳…

**Java面試:技術大比拼**

互聯網大廠Java面試&#xff1a;一場嚴肅與搞笑交織的技術拷問 場景&#xff1a;互聯網大廠面試間 面試官&#xff08;嚴肅&#xff09;&#xff1a;請坐。馬小帥&#xff0c;我們今天主要考察一下你在Java技術棧上的掌握程度&#xff0c;以及如何將這些技術應用于實際業務場景…

25考頻高的前端面試題

請求失敗會彈出一個toast&#xff0c;如何保證批量請求失敗&#xff0c;只彈出一個toast 設置全局標志位&#xff0c;定義一個全局變量&#xff08;如isToastShown)來表示是否已經彈出過toast。在請求失敗的處理邏輯中&#xff0c;首先檢查該標志位。如果尚未彈出toast&#xf…

命令模式(Command Pattern)詳解

文章目錄 1. 什么是命令模式?2. 為什么需要命令模式?3. 命令模式的核心概念4. 命令模式的結構5. 命令模式的基本實現5.1 簡單的燈光控制示例5.2 家電控制示例6. 帶有撤銷功能的命令模式6.1 修改命令接口6.2 實現可撤銷的燈光命令6.3 實現可撤銷的風扇命令6.4 修改調用者,支持…

《Vue3學習手記8》

vue3中的一些API shallowRef ( ) 和shallowReactive ( ) shallowRef (淺層響應式) 1.作用:創建一個響應式數據&#xff0c;但只對頂層屬性進行響應式處理。 2.用法: const originalref(...) const original2shallowRef(original) 3.特點:只跟蹤引用值的變化&#xff0c;不關心…