PDFMathTranslate:科學 PDF 文件翻譯及雙語對照工具
在科研和學習過程中,我們經常會遇到大量的英文 PDF 文獻,翻譯這些文獻成為了一項繁瑣且耗時的工作。PDFMathTranslate 是一款強大的科學 PDF 文件翻譯及雙語對照工具,它能夠保留公式、圖表、目錄和注釋,支持多種語言和諸多翻譯服務,還提供了命令行工具、圖形用戶界面以及容器化部署等多種使用方式。本文將詳細介紹 PDFMathTranslate 的功能、安裝方法和使用教程。
一、功能特點
- 保留關鍵元素:能夠保留 PDF 文件中的公式、圖表、目錄和注釋,確保翻譯后的文檔格式完整。
- 多語言支持:支持多種語言的翻譯,滿足不同用戶的需求。
- 多種翻譯服務:集成了多種翻譯服務,如 Google、Bing、DeepL 等,用戶可以根據自己的需求選擇合適的翻譯服務。
- 多種使用方式:提供命令行工具、圖形用戶界面和容器化部署等多種使用方式,方便不同場景下的使用。
二、安裝方法
PDFMathTranslate 提供了多種安裝方法,用戶可以根據自己的需求選擇合適的安裝方式。
1. UV 安裝
# 安裝 Python (3.10 <= 版本 <= 3.12)
# 安裝 uv 工具
pip install uv
# 使用 uv 工具安裝 pdf2zh
uv tool install --python 3.12 pdf2zh
2. Windows exe 安裝
從 發布頁面 下載 pdf2zh-version-win64.zip
,解壓縮并雙擊 pdf2zh.exe
運行。
3. 圖形用戶界面 (GUI) 安裝
# 安裝 Python (3.10 <= 版本 <= 3.12)
# 安裝 pdf2zh 包
pip install pdf2zh
# 在瀏覽器中開始使用
pdf2zh -i
如果瀏覽器沒有自動啟動,請訪問 http://localhost:7860/
。
4. Docker 安裝
# 拉取 Docker 鏡像
docker pull byaidu/pdf2zh
# 運行 Docker 容器
docker run -d -p 7860:7860 byaidu/pdf2zh
在瀏覽器中打開 http://localhost:7860/
。
對于云服務上的 Docker 部署,還提供了多種一鍵部署的鏈接:
- Heroku
- Render
- Zeabur
- Sealos
- Koyeb
三、使用教程
1. 命令行工具使用
# 執行翻譯,文件生成在當前工作目錄
pdf2zh document.pdf
2. 圖形用戶界面使用
打開瀏覽器,訪問 http://localhost:7860/
,在界面中上傳需要翻譯的 PDF 文件,選擇翻譯服務和目標語言,點擊翻譯按鈕即可開始翻譯。
3. 高級使用選項
選項 | 功能 | 示例 |
---|---|---|
-f , -c | 異常 | pdf2zh example.pdf -f "(MS.*)" |
-cp | 兼容模式 | pdf2zh example.pdf --compatible |
--share | 公開鏈接 | pdf2zh -i --share |
--authorized | 授權 | pdf2zh -i --authorized users.txt [auth.html] |
--prompt | 自定義提示 | pdf2zh --prompt [prompt.txt] |
--onnx | [使用自定義 DocLayout-YOLO ONNX 模型] | pdf2zh --onnx [onnx/model/path] |
--serverport | [使用自定義 WebUI 端口] | pdf2zh --serverport 7860 |
--dir | [批量翻譯] | pdf2zh --dir /path/to/translate/ |
--config | 配置文件 | pdf2zh --config /path/to/config/config.json |
4. 無法安裝時的解決方案
- Python API:可以在其他 Python 程序中使用該程序,詳細信息請參考 Python API 文檔。
- HTTP API:可以與已安裝該程序的服務器進行通信,詳細信息請參考 HTTP API 文檔。
四、待辦事項
項目還有一些待辦事項,如使用基于 DocLayNet 的模型解析布局、修復頁面旋轉和目錄格式、支持非 PDF/A 文件等,感興趣的開發者可以參與項目的開發。
五、致謝
Immersive Translation 為此項目的活躍貢獻者提供每月的專業會員兌換碼,詳細信息請查看 CONTRIBUTOR_REWARD.md。
六、總結
PDFMathTranslate 是一款功能強大、使用方便的科學 PDF 文件翻譯及雙語對照工具,它提供了多種安裝和使用方式,能夠滿足不同用戶的需求。無論是科研人員、學生還是其他需要翻譯 PDF 文獻的用戶,都可以嘗試使用 PDFMathTranslate 來提高翻譯效率。