分享一個非常實用的PDF文檔翻譯項目——PDFMathTranslate。作為一個經常逛GitHub的開發者,我總喜歡翻看各種項目附帶的論文,雖然大多時候是瞎研究,但卻樂在其中。該項目能夠完美保留公式、圖表、目錄和注釋,對于需要閱讀外文文獻的同學來說絕對是一個利器!(外語好的當我沒說哈!)
先來看看效果,這是我用GitHub - memoavatar/memo: Memory-Guided Diffusion for Expressive Talking Video Generation該項目的論文進行翻譯的結果。
論文鏈接https://arxiv.org/abs/2412.04448
效果非常不錯,當然你不僅可以用它翻譯論文,任何PDF內容都支持。
只支持PDF,如果是word等其他格式的,需要轉成PDF格式來進行處理
本地部署
如果想在本地部署開發,有以下幾種方式,要用整合包,可以跳過這部分。
- 命令行方式:
pip install pdf2zh
pdf2zh document.pdf
- 圖形界面方式:
pip install pdf2zh
pdf2zh -i
然后在瀏覽器打開 http://localhost:7860 即可使用。
- Docker部署:
docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zh
🔧 進階功能:
- 部分翻譯:如果只需要翻譯特定頁面,可以使用 -p 參數
pdf2zh example.pdf -p 1-3,5
- 自定義語言:支持指定源語言和目標語言
pdf2zh example.pdf -li en -lo ja
- 選擇翻譯服務:可以根據需求切換不同的翻譯服務
pdf2zh example.pdf -s openai:gpt-4
快速上手
最簡單的使用方式是訪問官方提供的在線服務:PDFMathTranslate - PDF Translation with preserved formats
無需安裝任何東西,直接上傳PDF即可獲得翻譯結果。
需要注意的是在線服務考慮到服務器壓力,上傳的PDF文件大小不能超過5M。如果要翻譯大于5M的,咱們建議還是用整合包或者本地部署。
簡單說下使用方法,沒什么難度。
類型
類型這里有兩種選擇,一種是直接上傳本地的PDF文件。
一種是直接復制鏈接進去。
例如:https://arxiv.org/pdf/2412.04448
翻譯服務
這里選擇對應的翻譯服務
需要注意的是某些翻譯服務需要用到API,需要到對應的平臺上去申請。
翻譯語言設置
這個也不用過多介紹
可以看到支持的語言列表
頁面范圍
翻譯的范圍。對于大型PDF文檔,建議先試譯幾頁看看效果
批量處理
在使用的時候,考慮到有時候不是一個文檔需要翻譯,但是每次都要設置,然后來回點擊也挺麻煩的。
于是我動動手,加了批量功能。
可以添加多個PDF進行處理。
處理好的文件點擊打開默認輸出文件夾
即可找到
一個pdf會生成三個文件。
2412.04448v1
原文件。
2412.04448v1-zh
翻譯后的文件。
2412.04448v1-dual
翻譯后的雙語文件。
需要注意
💡翻譯服務中例如谷歌、必應、DeepL、Azure等國外服務需開啟對應的網絡環境。
配置要求
WIN
WindowsN卡需2G顯存
如果整合包運行報錯,需要安裝cuda12.4或cuda11.8
https://developer.nvidia.com/cuda-12-4-0-download-archive
MAC
MAC Apple Silicon M1/M2/M3/M4 芯片
2G內存
整合包獲取
👇🏻👇🏻👇🏻下方下方下方👇🏻👇🏻👇🏻
https://pan.quark.cn/s/a34b907537f0
?
https://pan.baidu.com/s/1Q8F3dFg1XUxCOD_O_QuuoQ?pwd=bzzv
如果發了關鍵詞沒回復你!記得看下復制的時候是不是把空格給粘貼進去了!
制作不易,如果本文對您有幫助,還請點個免費的贊或在看!感謝您的閱讀!