目錄
1.介紹
2.項目亮點
3.項目功能(已實現)
4.功能體驗
5.項目集成(調用接口)
6.項目地址
1.介紹
????????Umi-OCR:免費,開源,可批量的離線OCR軟件,目前適用于 Windows7 x64 及以上。
????????這個項目基于基于 PaddleOCR,支持截圖識別、批量導入識別、個性化識別等功能。
????????整個項目由 python 語言編寫,win7系統的小伙伴大概率是用不了的。推薦 Win10 x64 及以上版本。
2.項目亮點
免費
本項目所有代碼開源,完全免費。
方便
解壓即用,離線運行,無需網絡。
高效
自帶高效率的離線OCR引擎,內置多種語言識別庫。
靈活
支持命令行、HTTP接口等外部調用方式。
功能
截圖OCR / 批量OCR / PDF識別 / 二維碼 / 公式識別(測試中)
3.項目功能(已實現)
-
標簽頁框架。
-
OCR API控制器。
-
OCR 任務控制器。
-
主題管理器,支持切換淺色/深色主題主題。
-
實現?批量OCR。
-
實現?截圖OCR。
-
快捷鍵機制。
-
系統托盤菜單。
-
文本塊后處理(排版優化)。
-
引擎內存清理。
-
軟件界面多國語言。
-
命令行模式。
-
Win7兼容。
-
Excel(csv)輸出格式。
-
Esc
中斷截圖操作 -
外置主題文件
-
字體切換
-
加載動畫
-
忽略區域。
-
二維碼識別。
-
批量識別頁面的圖片預覽窗口。
-
PDF識別。
-
調用本地圖片瀏覽器打開圖片。?#335
-
重復上一次截圖。?#357
-
修Bug:文檔識別在Windows7系統的兼容性問題。
-
HTTP/命令行接口添加二維碼識別/生成功能。(#423)
-
二維碼接口的文檔。
4.功能體驗
界面語言
直接在releases中選擇合適的版本,下載解壓即可。
可以看到,項目還配套了英、日、韓等多個國家的語言識別庫,方便國外的這些用戶使用。
截圖識別OCR
截圖OCR:打開這一頁后,就可以用快捷鍵喚起截圖,識別圖中的文字。
- 左側的圖片預覽欄,可直接用鼠標劃選復制。
- 右側的識別記錄欄,可以編輯文字,允許劃選多個記錄復制。
- 也支持在別處復制圖片,粘貼到Umi-OCR進行識別。
文本后處理
關于?OCR文本后處理 - 排版解析方案: 可以整理OCR結果的排版和順序,使文本更適合閱讀和使用。預設方案:
多欄-按自然段換行
:適合大部分情景,自動識別多欄布局,按自然段規則進行換行。多欄-總是換行
:每段語句都進行換行。多欄-無換行
:強制將所有語句合并到同一行。單欄-按自然段換行
/總是換行
/無換行
:與上述類似,不過 不區分多欄布局。單欄-保留縮進
:適用于解析代碼截圖,保留行首縮進和行中空格。不做處理
:OCR引擎的原始輸出,默認每段語句都進行換行。
上述方案,均能自動處理橫排和豎排(從右到左)的排版。(豎排文字還需要OCR引擎本身支持)
批量OCR
批量OCR:這一頁用于批量導入本地圖片進行識別。
- 支持格式:
jpg, jpe, jpeg, jfif, png, webp, bmp, tif, tiff
。 - 保存識別結果的支持格式:
txt, jsonl, md, csv(Excel)
。 - 與截圖OCR一樣,支持
文本后處理
功能,整理OCR文本的排版和順序。 - 沒有數量上限,可一次性導入幾百張圖片進行任務。
- 支持任務完成后自動關機/待機。
- 如果要識別像素超大的長圖或大圖,請調整:頁面的設置→文字識別→限制圖像邊長→【調高數值】。
- 擁有特殊功能?
忽略區域
?。
文檔識別
文檔識別:
- 支持格式:
pdf, xps, epub, mobi, fb2, cbz
。 - 對掃描件進行OCR,或提取原有文本。可輸出為?雙層可搜索PDF?。
- 支持設定?忽略區域?,可用于排除頁眉頁腳的文字。
- 可設置任務完成后?自動關機/休眠?。
二維碼
掃碼:
- 截圖/粘貼/拖入本地圖片,讀取其中的二維碼、條形碼。
- 支持一圖多碼。
- 支持19種協議,如下:
Aztec
,Codabar
,Code128
,Code39
,Code93
,DataBar
,DataBarExpanded
,DataMatrix
,EAN13
,EAN8
,ITF
,LinearCodes
,MatrixCodes
,MaxiCode
,MicroQRCode
,PDF417
,QRCode
,UPCA
,UPCE
生成碼:
- 輸入文本,生成二維碼圖片。
- 支持19種協議和糾錯等級等參數。
全局設置
全局設置:在這里可以調整軟件的全局參數。常用功能如下:
- 一鍵添加快捷方式或設置開機自啟。
- 更改界面語言。Umi支持繁中、英語、日語等語言。
- 切換界面主題。Umi擁有多個亮/暗主題。
- 調整界面文字的大小和字體。
- 切換OCR插件。
- 渲染器:軟件界面默認支持顯卡加速渲染。如果在你的機器上出現截屏閃爍、UI錯位的情況,請調整
界面和外觀
?→?渲染器
?,嘗試切換到不同渲染方案,或關閉硬件加速。
5.項目集成(調用接口)
基礎說明
如上圖,必須允許HTTP服務才能使用HTTP接口(默認開啟)。如果需要允許被局域網訪問,請將主機切換到任何可用地址
。
在全局設置頁中勾選高級
才會顯示。
1)?圖片OCR:Base64 識別接口
傳入一個base64編碼的圖片,返回OCR識別結果。
URL:/api/ocr
例:http://127.0.0.1:1224/api/ocr
(實際端口請在全局設置中查看)
2)?圖片OCR:參數查詢接口
返回當前需要提供哪些options參數。
URL:/api/ocr/get_options
例:http://127.0.0.1:1224/api/ocr/get_options
3)?二維碼:Base64 識別接口
傳入一個base64編碼的圖片,返回二維碼識別結果。
URL:/api/qrcode
例:http://127.0.0.1:1224/api/qrcode
4) 二維碼:從文本生成圖片
傳入文本,根據文本生成二維碼圖片,返回圖片base64。
URL:/api/qrcode
?(與二維碼識別接口一致,只是參數不同)
例:http://127.0.0.1:1224/api/qrcode
6.項目地址
【github】:https://github.com/hiroi-sora/Umi-OCR