免費開源圖片轉文字識別軟件:Umi-OCR

目錄

1.介紹

2.項目亮點

3.項目功能(已實現)

4.功能體驗

5.項目集成(調用接口)

6.項目地址


1.介紹

????????Umi-OCR:免費,開源,可批量的離線OCR軟件,目前適用于 Windows7 x64 及以上。

????????這個項目基于基于 PaddleOCR,支持截圖識別、批量導入識別、個性化識別等功能。

????????整個項目由 python 語言編寫,win7系統的小伙伴大概率是用不了的。推薦 Win10 x64 及以上版本。

2.項目亮點

免費

本項目所有代碼開源,完全免費。

方便

解壓即用,離線運行,無需網絡。

高效

自帶高效率的離線OCR引擎,內置多種語言識別庫。

靈活

支持命令行、HTTP接口等外部調用方式。

功能

截圖OCR / 批量OCR / PDF識別 / 二維碼 / 公式識別(測試中)

3.項目功能(已實現)

  • 標簽頁框架。

  • OCR API控制器。

  • OCR 任務控制器。

  • 主題管理器,支持切換淺色/深色主題主題。

  • 實現?批量OCR

  • 實現?截圖OCR

  • 快捷鍵機制。

  • 系統托盤菜單。

  • 文本塊后處理(排版優化)。

  • 引擎內存清理。

  • 軟件界面多國語言。

  • 命令行模式。

  • Win7兼容。

  • Excel(csv)輸出格式。

  • Esc中斷截圖操作

  • 外置主題文件

  • 字體切換

  • 加載動畫

  • 忽略區域。

  • 二維碼識別。

  • 批量識別頁面的圖片預覽窗口。

  • PDF識別。

  • 調用本地圖片瀏覽器打開圖片。?#335

  • 重復上一次截圖。?#357

  • 修Bug:文檔識別在Windows7系統的兼容性問題。

  • HTTP/命令行接口添加二維碼識別/生成功能。(#423)

  • 二維碼接口的文檔。

4.功能體驗

界面語言

直接在releases中選擇合適的版本,下載解壓即可。

可以看到,項目還配套了英、日、韓等多個國家的語言識別庫,方便國外的這些用戶使用。

截圖識別OCR

截圖OCR:打開這一頁后,就可以用快捷鍵喚起截圖,識別圖中的文字。

  • 左側的圖片預覽欄,可直接用鼠標劃選復制。
  • 右側的識別記錄欄,可以編輯文字,允許劃選多個記錄復制。
  • 也支持在別處復制圖片,粘貼到Umi-OCR進行識別。

文本后處理

關于?OCR文本后處理 - 排版解析方案: 可以整理OCR結果的排版和順序,使文本更適合閱讀和使用。預設方案:

  • 多欄-按自然段換行:適合大部分情景,自動識別多欄布局,按自然段規則進行換行。
  • 多欄-總是換行:每段語句都進行換行。
  • 多欄-無換行:強制將所有語句合并到同一行。
  • 單欄-按自然段換行/總是換行/無換行:與上述類似,不過 不區分多欄布局。
  • 單欄-保留縮進:適用于解析代碼截圖,保留行首縮進和行中空格。
  • 不做處理:OCR引擎的原始輸出,默認每段語句都進行換行。

上述方案,均能自動處理橫排和豎排(從右到左)的排版。(豎排文字還需要OCR引擎本身支持)

批量OCR

批量OCR:這一頁用于批量導入本地圖片進行識別。

  • 支持格式:jpg, jpe, jpeg, jfif, png, webp, bmp, tif, tiff
  • 保存識別結果的支持格式:txt, jsonl, md, csv(Excel)
  • 與截圖OCR一樣,支持文本后處理功能,整理OCR文本的排版和順序。
  • 沒有數量上限,可一次性導入幾百張圖片進行任務。
  • 支持任務完成后自動關機/待機。
  • 如果要識別像素超大的長圖或大圖,請調整:頁面的設置→文字識別→限制圖像邊長→【調高數值】
  • 擁有特殊功能?忽略區域?。

文檔識別

文檔識別

  • 支持格式:pdf, xps, epub, mobi, fb2, cbz
  • 對掃描件進行OCR,或提取原有文本。可輸出為?雙層可搜索PDF?。
  • 支持設定?忽略區域?,可用于排除頁眉頁腳的文字。
  • 可設置任務完成后?自動關機/休眠?。

二維碼

掃碼

  • 截圖/粘貼/拖入本地圖片,讀取其中的二維碼、條形碼。
  • 支持一圖多碼。
  • 支持19種協議,如下:

Aztec,Codabar,Code128,Code39,Code93,DataBar,DataBarExpanded,DataMatrix,EAN13,EAN8,ITF,LinearCodes,MatrixCodes,MaxiCode,MicroQRCode,PDF417,QRCode,UPCA,UPCE

生成碼

  • 輸入文本,生成二維碼圖片。
  • 支持19種協議和糾錯等級等參數。

全局設置

全局設置:在這里可以調整軟件的全局參數。常用功能如下:

  • 一鍵添加快捷方式或設置開機自啟。
  • 更改界面語言。Umi支持繁中、英語、日語等語言。
  • 切換界面主題。Umi擁有多個亮/暗主題。
  • 調整界面文字的大小字體
  • 切換OCR插件。
  • 渲染器:軟件界面默認支持顯卡加速渲染。如果在你的機器上出現截屏閃爍、UI錯位的情況,請調整界面和外觀?→?渲染器?,嘗試切換到不同渲染方案,或關閉硬件加速。

5.項目集成(調用接口)

基礎說明

如上圖,必須允許HTTP服務才能使用HTTP接口(默認開啟)。如果需要允許被局域網訪問,請將主機切換到任何可用地址

在全局設置頁中勾選高級才會顯示。

1)?圖片OCR:Base64 識別接口

傳入一個base64編碼的圖片,返回OCR識別結果。

URL:/api/ocr

例:http://127.0.0.1:1224/api/ocr(實際端口請在全局設置中查看)

2)?圖片OCR:參數查詢接口

返回當前需要提供哪些options參數。

URL:/api/ocr/get_options

例:http://127.0.0.1:1224/api/ocr/get_options

3)?二維碼:Base64 識別接口

傳入一個base64編碼的圖片,返回二維碼識別結果。

URL:/api/qrcode

例:http://127.0.0.1:1224/api/qrcode

4) 二維碼:從文本生成圖片

傳入文本,根據文本生成二維碼圖片,返回圖片base64。

URL:/api/qrcode?(與二維碼識別接口一致,只是參數不同)

例:http://127.0.0.1:1224/api/qrcode

6.項目地址

【github】:https://github.com/hiroi-sora/Umi-OCR

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/22813.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/22813.shtml
英文地址,請注明出處:http://en.pswp.cn/web/22813.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

自動化辦公02 用openpyxl庫操作excel.xlsx文件(新版本)

目錄 一、文件讀操作 二、文件寫操作 三、修改單元格樣式 openpyxl 是一個處理Excel表格的第三方庫。openpyxl 庫可以處理Excel2010以后的電子表格格式,包括:xlsx/xlsm/xltx/xltm。 openpyxl教程 一、文件讀操作 工作簿(workbook): excel文件 工作表…

word自帶公式編輯器技巧

1.實現多行公式換行且對齊 1.1 準備階段(默認Unicode模式) 進入公式編輯模式,輸入\eqarray,緊接著按下空格鍵輸入空格,如下 1.2 實現換行和對齊 將要編輯的公式輸入到括號內 &:實現位置對齊 &…

104.網絡游戲逆向分析與漏洞攻防-裝備系統數據分析-篩選與裝備有關的數據包

免責聲明:內容僅供學習參考,請合法利用知識,禁止進行違法犯罪活動! 如果看不懂、不知道現在做的什么,那就跟著做完看效果,代碼看不懂是正常的,只要會抄就行,抄著抄著就能懂了 內容…

【Android】PopupWindow焦點控制方式解析

touchable 指定pop是否可觸摸 當設置為false時,pop的所有觸摸事件會直接傳到下方Window,pop會關閉 focusable 指定pop是否可獲得焦點 當設置為true時,如果pop中包含可獲取焦點的控件,舊的Window會自動失去焦點 另外&#xf…

postman教程-15-前置腳本

上一小節我們學習了Postman生成隨機數的方法,本小節我們講解一下Postman前置腳本的使用方法。 Postman中的前置腳本(Pre-request Script)允許你在發送請求之前運行JavaScript代碼。這可以用于修改請求頭、查詢參數、請求體等,或者…

合作伙伴中心是什么?

目錄 合作伙伴中心介紹 合作伙伴中心的功能 合作伙伴中心介紹 合作伙伴中心,作為Microsoft合作伙伴與Microsoft及其客戶之間關系管理的重要工具,為合作伙伴提供了簡化業務流程的便利。通過合作伙伴中心,合作伙伴可以輕松地管理Microsoft賬戶和用戶,與客戶互動,建立與其他…

web學習筆記(六十二)

目錄 1.鍵盤事件 2.KeepAlive 3.組件傳值 3.1 兄弟組件傳值 3.2 組件樹傳值 3.3 發布訂閱者傳值 1.鍵盤事件 keydown表示鍵盤事件&#xff0c;在不加修飾符的情況下&#xff0c;點擊鍵盤上的任意位置都可以觸發鍵盤事件&#xff0c; <template><div><!--…

word 無法自動檢測拼寫

word 有時候不能分辨是哪種語言,比如把英語錯認為法語 。 例如&#xff1a;Interlaayer spacace,發現誤認為是法語。 1、選中Interlaayer spacace 2、點擊語言下拉按鈕 選擇設置校對語言 發現校對語言為法語 3、手動修改校對語言為英語&#xff0c;并點擊確認。 4、發現現…

什么是 Batch Normalization 批標準化和全連接層

Batch Normalization 神經元在經過激活函數之后會處于飽和狀態&#xff0c;無論后續怎么變化都不會再起作用。 每一層都會進行batch normalization的處理&#xff01; without normalization 會導致數據分布再飽和區 全連接層&#xff1a; 全連接層(fully connected layers&a…

十四、返回Insert操作自增索引值

分為兩部分&#xff0c;解析初始化和使用 拿含有selectkey標簽的insert語句解析來說 解析部分 1.解析時看有沒有selectkey標簽&#xff0c;有的話先解析selectkey的內容&#xff0c;包括對其SQL的解析并封裝成一個MappedStatement和創建KeyGenerator放入configuration中 2.解…

SpringBoot集成ClickHouse,含集成kerberos認證

需求&#xff1a;項目中要使用ClickHouse做數據庫。 具體實現&#xff1a; 1&#xff0c;在pom.xml中添加clickhouse依賴 <!-- https://mvnrepository.com/artifact/com.clickhouse/clickhouse-jdbc --> <dependency><groupId>com.clickhouse</groupId&g…

SpringBoot前端URL訪問本地磁盤文件

SpringBoot前端通過 URL訪問本地磁盤文件&#xff0c;其實就是 SpringBoot訪問web中的靜態資源的處理方式。 SpringBoot 訪問web中的靜態資源&#xff1a;https://blog.csdn.net/qq_42402854/article/details/90295079 首先&#xff0c;我們知道瀏覽器訪問本地磁盤文件的方式為…

LLM的基礎模型5:Embedding模型

大模型技術論文不斷&#xff0c;每個月總會新增上千篇。本專欄精選論文重點解讀&#xff0c;主題還是圍繞著行業實踐和工程量產。若在某個環節出現卡點&#xff0c;可以回到大模型必備腔調或者LLM背后的基礎模型新閱讀。而最新科技&#xff08;Mamba,xLSTM,KAN&#xff09;則提…

面試高頻問題----4

一、redis和mysql一致性怎么保證&#xff1f; 1.編寫刪除緩存的接口&#xff0c;在更新數據庫的同時&#xff0c;調用刪除緩存的接口刪除緩存中的數據。 2.消息隊列&#xff1a;ActiveMQ、消息通知&#xff1b;將更新操作發送到消息隊列中&#xff0c;順序更新mysql和redis。…

三十七、openlayers官網示例Earthquakes Heatmap解析——在地圖上加載熱力圖

官網demo地址&#xff1a; Earthquakes Heatmap 這篇主要介紹了熱力圖HeatmapLayer HeatmapLayer 是一個用于在地圖上顯示熱力圖的圖層類型&#xff0c;通常用于表示地理數據中的密度或強度。例如&#xff0c;它可以用來顯示地震、人口密度或其他空間數據的熱點區域。在這個示…

Siemens-NXUG二次開發-創建倒斜角特征、邊倒圓角特征、設置對象顏色、獲取面信息[Python UF][20240605]

Siemens-NXUG二次開發-創建倒斜角特征、邊倒圓角特征、設置對象顏色、獲取面信息[Python UF][20240605] 1.python uf函數1.1 NXOpen.UF.Modeling.AskFaceData1.2 NXOpen.UF.Modeling.CreateChamfer1.3 NXOpen.UF.ModlFeatures.CreateBlend1.4 NXOpen.UF.Obj.SetColor 2.實體目標…

lib庫和dll庫的介紹和使用

lib&#xff08;靜態庫&#xff09; 靜態庫定義&#xff1a;.lib文件是靜態庫文件&#xff0c;包含了在編譯時被鏈接到目標程序的代碼。使用靜態庫時&#xff0c;庫的代碼會被復制到最終生成的可執行文件中。優點&#xff1a; 性能&#xff1a;由于庫代碼在編譯時就被集成到可…

分布式架構與分布式理論

文章目錄 分布式架構什么是分布式系統分布式系統特性分布式系統面臨的問題 分布式理論數據一致性CAP理論BASE理論 分布式架構 什么是分布式系統 分布式系統是一個硬件或軟件組件分布在不同的網絡計算機上&#xff0c;彼此之間僅僅通過消息傳遞進行通信和協調的系統。 所謂分…

Vue的APP實現下載文件功能,并將文件保存到手機中

Vue的APP實現下載文件功能&#xff0c;并將文件保存到手機中 文字說明后臺核心代碼前臺核心代碼運行截圖項目鏈接 文字說明 本文介紹Vue實現的APP&#xff0c;將文件下載并保存到手機中&#xff0c;為系統提供導出功能&#xff1b;同時支持導入&#xff0c;即選擇本地的文件后&…

Ubuntu18.04 文件管理器無法打開的解決方法

問題&#xff1a;打開Ubuntu虛擬機發現文件管理器無法打開,一直在轉圈圈 在終端中輸入 nautilus 顯示如下信息 nautilus: symbol lookup error: /usr/lib/x86_64-linux-gnu/tracker-2.0/libtracker-data.so.0: undefined symbol: sqlite3_bind_pointer 解決措施&#xff1a…