工具介紹
Umi-OCR 是一款免費、開源的離線OCR軟件,主要由作者 hiroi-sora 用業余時間在開發和維護。
Umi-OCR 內置多國語言庫,支持截屏/批量導入圖片,PDF文檔識別,排除水印/頁眉頁腳以及二維碼的掃描/生成。
適用平臺:Windows7 x64 、Linux x64
Umi-OCR 具有以下核心優勢和特色功能👇
- 免費:本項目所有代碼開源,完全免費
- 方便:解壓即用,離線運行,無需網絡
- 高效:自帶高效率的離線OCR引擎,內置多種語言識別庫
- 靈活:支持命令行、HTTP接口等外部調用方式
- 功能:截圖OCR / 批量OCR / PDF識別 / 二維碼 / 公式識別
Linux x64 部署
Linux x64 部署教程(可以基于Docker部署)請參考:https://github.com/hiroi-sora/Umi-OCR_runtime_linux
Linux x64 已通過作者測試的系統:
👉 主機部署:Ubuntu 22.04 / Debian 12.5 / Kali 2023.3
👉 Docker 部署:CentOS 7
主機部署
Umi-OCR_Linux_Paddle_2.1.5.tar.xz (264.5MB)
SHA256: 7ff32e5dc818d67171820545100433c86e7e71155f9bad0851fad2ced9588f9b
首次運行請在命令行中執行 ./umi-ocr.sh
,隨后可在全局設置中創建桌面/開始菜單快捷方式,便于日常使用。
Docker部署
請按照文檔提供的步驟進行:https://github.com/hiroi-sora/Umi-OCR_runtime_linux/blob/main/README-docker.md
Windows7 x64 部署
不同版本僅OCR引擎插件不同,其它功能完全一致,附帶多國語言識別庫。.7z.exe
為自解壓包,可以用壓縮軟件打開,也可以在沒有安裝壓縮軟件的電腦上直接雙擊解壓。
一、Paddle 引擎插件版
特點:性能好,速度快,占用率高,適合高配機器(不兼容奔騰、賽揚、凌動CPU)
??重要提示:如果執行OCR時報錯 0xc0000142、[Error] OCR init fail
,大概率是CPU不兼容Paddle,請換用Rapid版本。
Umi-OCR_Paddle_v2.1.5.7z.exe (128MB)
SHA256: abe00248d6e68dda75029739751ad7258f0ecc14d720b19240a844f5341859b2
二、Rapid 引擎插件版
特點:速度稍慢,內存占用低,適合低配機器,兼容性好
Umi-OCR_Rapid_v2.1.5.7z.exe (98.5MB)
SHA256: 659c55896c32a5e019dc7bde1713d0e5c73186a2c653bed84c4480fa1795b722
更多下載途徑: 藍奏云 | SourceForge | Scoop
比如通過SourceForge,選擇Paddle 引擎插件版進行.exe
文件的下載。
功能使用
中文用戶可以在應用安裝成功之后,在「全局設置」中將默認的英文語言修改為中文。
在「功能頁」,我們可以看到應用提供的核心功能。
我們試試截圖OCR的效果吧~
截圖可以通過拖入和粘貼這兩種方式進行導入,我這邊選擇了一篇wechat公眾號文章(谷歌AI掌門人親述:十年內終結疾病?揭秘99%人不知道的AI革命真相?)里帶文字的一張圖片:
除了最上方花式字體的雙引號識別成了“GG”,其他英文識別還是沒有問題的。
識別完成后,我們可以全選OCR識別出來的文字內容進行復制。
使用感受分享
不知道是不是我的打開方式不對,雖然簡單測試下的效果還不錯,但整體使用感受并不不算特別絲滑~總覺得卡卡的,可能是運行的服務器性能不夠?
Anyway,作者利用自己的業余時間開發維護這樣一個可以本地離線使用的OCR軟件并開源分享給大家已經很棒啦~有需要的朋友可以下載嘗試看看!