簡介
什么是 PDF3MD ?
PDF3MD
是一個現代化、用戶友好的網絡應用程序,旨在將Markdown
文本。它提供了高效的轉換工具,支持多種文件格式之間的轉換。
主要特點
- PDF 轉 Markdown:能夠將
PDF
文檔轉換為可讀性強的Markdown
格式,同時保留文檔的結構元素。 - Markdown 轉 Word (DOCX):支持將用戶提供的
Markdown
文本轉換為DOCX
格式,使用Pandoc
實現高質量輸出。 - 多文件上傳:支持同時上傳和處理多個
PDF
文件,提升工作效率。 - 拖拽式界面:提供用戶友好的文件上傳方式,支持拖放或傳統的文件選擇。
- 實時進度跟蹤:在轉換過程中提供詳細的狀態更新,用戶可以實時監控轉換進度。
- 現代響應式用戶界面:設計直觀,適合各種設備使用。
應用場景
- 文檔轉換:適用于需要將
PDF
文檔轉換為Markdown
的用戶,例如技術文檔編輯、博客撰寫等。 - 內容編輯:方便用戶在
Markdown
格式下進行內容編輯和格式化,然后可以輕松導出為Word
文檔。 - 批量處理:適合需要處理大量文檔的場景,例如教育機構、出版社等。
PDF3MD
通過提供簡化的文檔轉換流程,大大提升了用戶的工作效率和體驗。
安裝
在群暉上以 Docker 方式安裝。
本文寫作時,
latest
版本對應為sha-229610b
;
采用 docker-compose
安裝,將下面的內容保存為 docker-compose.yml
文件
services:backend:image: learnedmachine/pdf3md-backend:latest container_name: pdf3md-backendrestart: unless-stoppedports:- "6201:6201"volumes:- ./data:/app/tempenvironment:- PYTHONUNBUFFERED=1- FLASK_ENV=production- TZ=Asia/Shanghaihealthcheck:test: ["CMD", "curl", "-f", "http://localhost:6201/"]interval: 30stimeout: 10sretries: 3start_period: 40sfrontend:image: learnedmachine/pdf3md-frontend:latest container_name: pdf3md-frontendrestart: unless-stoppedports:- "6202:3000"environment: {}depends_on:- backendhealthcheck:test: ["CMD", "wget", "--no-verbose", "--tries=1", "--spider", "http://localhost:3000/"]interval: 30stimeout: 10sretries: 3start_period: 40s
然后執行下面的命令
# 新建文件夾 pdf3md 和 子目錄
mkdir -p /volume1/docker/pdf3md/data# 進入 pdf3md 目錄
cd /volume1/docker/pdf3md# 將 docker-compose.yml 放入當前目錄# 一鍵啟動
docker-compose up -d
運行
在瀏覽器中輸入 http://群暉IP:6202
就能看到主界面
PDF 轉 MD
老蘇將本文在 obsidian
中轉成了 pdf
格式
然后將 pdf
丟進來 PDF3MD
轉換速度很快,雖然不能 100%
復原,但是也大差不差的
不要用那種掃描的 pdf
文件,畢竟還不支持 ocr
功能
MD 轉 Word
將 markdown
粘貼到文本框,轉換速度相對慢很多
但是效果看起來還是不錯的
參考文檔
murtaza-nasir/pdf3md: A modern, user-friendly web application that converts PDF documents to clean, formatted Markdown text.
地址:https://github.com/murtaza-nasir/pdf3md