免費開源圖片轉文字識別軟件:Umi-OCR

1.介紹

2.項目亮點

3.項目功能（已實現）

4.功能體驗

5.項目集成（調用接口）

6.項目地址

1.介紹

????????Umi-OCR：免費，開源，可批量的離線OCR軟件，目前適用于 Windows7 x64 及以上。

????????這個項目基于基于 PaddleOCR，支持截圖識別、批量導入識別、個性化識別等功能。

????????整個項目由 python 語言編寫，win7系統的小伙伴大概率是用不了的。推薦 Win10 x64 及以上版本。

2.項目亮點

免費

本項目所有代碼開源，完全免費。

方便

解壓即用，離線運行，無需網絡。

高效

自帶高效率的離線OCR引擎，內置多種語言識別庫。

靈活

支持命令行、HTTP接口等外部調用方式。

功能

截圖OCR / 批量OCR / PDF識別 / 二維碼 / 公式識別（測試中）

3.項目功能（已實現）

標簽頁框架。
OCR API控制器。
OCR 任務控制器。
主題管理器，支持切換淺色/深色主題主題。
實現?批量OCR。
實現?截圖OCR。
快捷鍵機制。
系統托盤菜單。
文本塊后處理（排版優化）。
引擎內存清理。
軟件界面多國語言。
命令行模式。
Win7兼容。
Excel（csv）輸出格式。
Esc中斷截圖操作
外置主題文件
字體切換
加載動畫
忽略區域。
二維碼識別。
批量識別頁面的圖片預覽窗口。
PDF識別。
調用本地圖片瀏覽器打開圖片。?#335
重復上一次截圖。?#357
修Bug：文檔識別在Windows7系統的兼容性問題。
HTTP/命令行接口添加二維碼識別/生成功能。(#423)
二維碼接口的文檔。

4.功能體驗

界面語言

直接在releases中選擇合適的版本，下載解壓即可。

可以看到，項目還配套了英、日、韓等多個國家的語言識別庫，方便國外的這些用戶使用。

截圖識別OCR

截圖OCR：打開這一頁后，就可以用快捷鍵喚起截圖，識別圖中的文字。

左側的圖片預覽欄，可直接用鼠標劃選復制。
右側的識別記錄欄，可以編輯文字，允許劃選多個記錄復制。
也支持在別處復制圖片，粘貼到Umi-OCR進行識別。

文本后處理

關于?OCR文本后處理 - 排版解析方案：可以整理OCR結果的排版和順序，使文本更適合閱讀和使用。預設方案：

多欄-按自然段換行：適合大部分情景，自動識別多欄布局，按自然段規則進行換行。
多欄-總是換行：每段語句都進行換行。
多欄-無換行：強制將所有語句合并到同一行。
單欄-按自然段換行/總是換行/無換行：與上述類似，不過不區分多欄布局。
單欄-保留縮進：適用于解析代碼截圖，保留行首縮進和行中空格。
不做處理：OCR引擎的原始輸出，默認每段語句都進行換行。

上述方案，均能自動處理橫排和豎排（從右到左）的排版。（豎排文字還需要OCR引擎本身支持）

批量OCR

批量OCR：這一頁用于批量導入本地圖片進行識別。

支持格式：jpg, jpe, jpeg, jfif, png, webp, bmp, tif, tiff。
保存識別結果的支持格式：txt, jsonl, md, csv(Excel)。
與截圖OCR一樣，支持文本后處理功能，整理OCR文本的排版和順序。
沒有數量上限，可一次性導入幾百張圖片進行任務。
支持任務完成后自動關機/待機。
如果要識別像素超大的長圖或大圖，請調整：頁面的設置→文字識別→限制圖像邊長→【調高數值】。
擁有特殊功能?忽略區域?。

文檔識別

文檔識別：

支持格式：pdf, xps, epub, mobi, fb2, cbz。
對掃描件進行OCR，或提取原有文本。可輸出為?雙層可搜索PDF?。
支持設定?忽略區域?，可用于排除頁眉頁腳的文字。
可設置任務完成后?自動關機/休眠?。

二維碼

掃碼：

截圖/粘貼/拖入本地圖片，讀取其中的二維碼、條形碼。
支持一圖多碼。
支持19種協議，如下：

Aztec,Codabar,Code128,Code39,Code93,DataBar,DataBarExpanded,DataMatrix,EAN13,EAN8,ITF,LinearCodes,MatrixCodes,MaxiCode,MicroQRCode,PDF417,QRCode,UPCA,UPCE

生成碼：

輸入文本，生成二維碼圖片。
支持19種協議和糾錯等級等參數。

全局設置

全局設置：在這里可以調整軟件的全局參數。常用功能如下：

一鍵添加快捷方式或設置開機自啟。
更改界面語言。Umi支持繁中、英語、日語等語言。
切換界面主題。Umi擁有多個亮/暗主題。
調整界面文字的大小和字體。
切換OCR插件。
渲染器：軟件界面默認支持顯卡加速渲染。如果在你的機器上出現截屏閃爍、UI錯位的情況，請調整界面和外觀?→?渲染器?，嘗試切換到不同渲染方案，或關閉硬件加速。

5.項目集成（調用接口）

基礎說明

如上圖，必須允許HTTP服務才能使用HTTP接口（默認開啟）。如果需要允許被局域網訪問，請將主機切換到任何可用地址。

在全局設置頁中勾選高級才會顯示。

1)?圖片OCR：Base64 識別接口

傳入一個base64編碼的圖片，返回OCR識別結果。

URL：/api/ocr

例：http://127.0.0.1:1224/api/ocr（實際端口請在全局設置中查看）

2)?圖片OCR：參數查詢接口

返回當前需要提供哪些options參數。

URL：/api/ocr/get_options

例：http://127.0.0.1:1224/api/ocr/get_options

3)?二維碼：Base64 識別接口

傳入一個base64編碼的圖片，返回二維碼識別結果。

URL：/api/qrcode

例：http://127.0.0.1:1224/api/qrcode

4) 二維碼：從文本生成圖片

傳入文本，根據文本生成二維碼圖片，返回圖片base64。

URL：/api/qrcode?（與二維碼識別接口一致，只是參數不同）

例：http://127.0.0.1:1224/api/qrcode

6.項目地址

【github】：https://github.com/hiroi-sora/Umi-OCR

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/22813.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/22813.shtml
英文地址，請注明出處：http://en.pswp.cn/web/22813.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！