Umi-OCR:Windows7和Linux上可免費離線使用的OCR應用!

工具介紹

Umi-OCR 是一款免費、開源的離線OCR軟件,主要由作者 hiroi-sora 用業余時間在開發和維護。
Umi-OCR 內置多國語言庫,支持截屏/批量導入圖片,PDF文檔識別,排除水印/頁眉頁腳以及二維碼的掃描/生成。

適用平臺:Windows7 x64Linux x64

Umi-OCR 具有以下核心優勢和特色功能👇

  • 免費:本項目所有代碼開源,完全免費
  • 方便:解壓即用,離線運行,無需網絡
  • 高效:自帶高效率的離線OCR引擎,內置多種語言識別庫
  • 靈活:支持命令行、HTTP接口等外部調用方式
  • 功能:截圖OCR / 批量OCR / PDF識別 / 二維碼 / 公式識別

Linux x64 部署

Linux x64 部署教程(可以基于Docker部署)請參考:https://github.com/hiroi-sora/Umi-OCR_runtime_linux

Linux x64 已通過作者測試的系統:
👉 主機部署:Ubuntu 22.04 / Debian 12.5 / Kali 2023.3
👉 Docker 部署:CentOS 7

主機部署

Umi-OCR_Linux_Paddle_2.1.5.tar.xz (264.5MB)

SHA256: 7ff32e5dc818d67171820545100433c86e7e71155f9bad0851fad2ced9588f9b

首次運行請在命令行中執行 ./umi-ocr.sh ,隨后可在全局設置中創建桌面/開始菜單快捷方式,便于日常使用。

Docker部署

請按照文檔提供的步驟進行:https://github.com/hiroi-sora/Umi-OCR_runtime_linux/blob/main/README-docker.md

Windows7 x64 部署

不同版本僅OCR引擎插件不同,其它功能完全一致,附帶多國語言識別庫。.7z.exe為自解壓包,可以用壓縮軟件打開,也可以在沒有安裝壓縮軟件的電腦上直接雙擊解壓。

一、Paddle 引擎插件版
特點:性能好,速度快,占用率高,適合高配機器(不兼容奔騰、賽揚、凌動CPU)
??重要提示:如果執行OCR時報錯 0xc0000142、[Error] OCR init fail,大概率是CPU不兼容Paddle,請換用Rapid版本

Umi-OCR_Paddle_v2.1.5.7z.exe (128MB)

SHA256: abe00248d6e68dda75029739751ad7258f0ecc14d720b19240a844f5341859b2

二、Rapid 引擎插件版
特點:速度稍慢,內存占用低,適合低配機器,兼容性好

Umi-OCR_Rapid_v2.1.5.7z.exe (98.5MB)

SHA256: 659c55896c32a5e019dc7bde1713d0e5c73186a2c653bed84c4480fa1795b722

更多下載途徑: 藍奏云 | SourceForge | Scoop

比如通過SourceForge,選擇Paddle 引擎插件版進行.exe文件的下載。
在這里插入圖片描述

功能使用

中文用戶可以在應用安裝成功之后,在「全局設置」中將默認的英文語言修改為中文。
在這里插入圖片描述
在「功能頁」,我們可以看到應用提供的核心功能。
在這里插入圖片描述
我們試試截圖OCR的效果吧~
截圖可以通過拖入和粘貼這兩種方式進行導入,我這邊選擇了一篇wechat公眾號文章(谷歌AI掌門人親述:十年內終結疾病?揭秘99%人不知道的AI革命真相?)里帶文字的一張圖片:
在這里插入圖片描述
除了最上方花式字體的雙引號識別成了“GG”,其他英文識別還是沒有問題的。
在這里插入圖片描述
識別完成后,我們可以全選OCR識別出來的文字內容進行復制。
在這里插入圖片描述

使用感受分享

不知道是不是我的打開方式不對,雖然簡單測試下的效果還不錯,但整體使用感受并不不算特別絲滑~總覺得卡卡的,可能是運行的服務器性能不夠?
Anyway,作者利用自己的業余時間開發維護這樣一個可以本地離線使用的OCR軟件并開源分享給大家已經很棒啦~有需要的朋友可以下載嘗試看看!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/921922.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/921922.shtml
英文地址,請注明出處:http://en.pswp.cn/news/921922.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

30 分鐘讓 AI 開口查訂單:React-Native + Coze 全鏈路語音對話落地指南

一、前言:為什么你需要“可說話、能查庫”的 AI? 聊天機器人在 2025 已不新鮮,但**“張嘴就能查詢私有業務數據”**的端到端方案依然踩坑無數: ASR/TTS 選型多、SDK 難對齊大模型與內部 API 安全打通RN 端流式渲染 音頻播放并發…

玄機--應急響應--webshell查殺

靶場連接1.黑客webshell里面的flag flag{xxxxx-xxxx-xxxx-xxxx-xxxx}使用命令查找特殊文件//搜索目錄下適配當前應用的網頁文件,查看內容是否有Webshell特征 find ./ type f -name "*.jsp" -exec grep -l "exec(" {} \; find ./ type f -name &…

Nodejs讀取目錄下面的文件

需求:給定一個目錄,讀取該目錄下面的所有文件,包括該目錄下面文件夾里面的子文件,子子文件......const fs require(fs);const path require(path);// 指定要遍歷的目錄const directoryPath D:\\;//調用函數入口處readDir(direc…

PPTist,一個完全免費的 AI 生成 PPT 在線網站

PPTist,一個完全免費的 AI 生成 PPT 在線網站 PPTist 是一個完全免費的 AI 生成 PPT 在線網站、PPT 在線演示網站、PPT 在線編輯網站。 它完全免費,無需登錄注冊,支持 AI 生成 PPT 功能,可以一句話生成 PPT ,支持輸入…

C++中操作重載與類型轉換

文章目錄基本概念調用選擇作為成員還是非成員輸入和輸出運算符算術和關系運算符相等和不等運算符賦值運算符下標運算符遞增和遞減運算符成員訪問運算符函數調用運算符lambda是函數對象標準庫定義的函數對象可調用對象與function重載、類型轉換與運算符類型轉換運算符避免有二義…

Java學習之——“IO流“的進階流之轉換流的學習

在博主的上一篇博文中,詳細的介紹了“IO”流中最基本的一些知識,包括基本的常見的字節流和字符流,以及對應的緩沖流,對于“IO”流基礎知識相對薄弱的同學可以先去看博主的上一篇博文Java學習之——萬字詳解“IO流”中基本的字節流…

PMP考試結構、學習框架與基本術語

一、PMP考試整體結構 考試基本信息 考試形式:紙筆考試(中國大陸地區)考試時長:230分鐘(約4小時)題目數量:180道題 170道單選題(四選一)10道多選題包含5道非計分的試驗題…

淺談前端框架

在 Web 開發的演進過程中,前端框架扮演著越來越重要的角色。從早期的 jQuery 到如今的 React、Vue、Svelte 等,前端開發模式發生了翻天覆地的變化。本文將從前端框架的定義、核心特性、分類以及主流框架的差異等方面,帶你深入理解前端框架。 …

10.3 馬爾可夫矩陣、人口和經濟

本節內容是關于正矩陣(postive matrices): 每個元素 aij>0a_{ij}>0aij?>0,它核心的結論是:最大的特征值為正實數,其對應的特征向量也是如此。 在經濟學、生態學、人口動力系統和隨機游走過程中都…

python學習進階之面向對象(二)

文章目錄 1.面向對象編程介紹 2.面向對象基本語法 3.面向對象的三大特征 4.面向對象其他語法 1.面向對象編程介紹 1.1 基本概念 概念:面向對象編程(Object-Oriented Programming, OOP)是一種流行的編程范式,它以"對象"為核心組織代碼和數據 在面向對象的世界里: …

VS+QT的編程開發工作:關于QT VS tools的使用 qt的官方幫助

加粗樣式 最近的工作用到VS2022QT5.9.9/QT5.12.9,在查找相關資料的時候,發現Qt 官方的資料還是很不錯的,特記錄下來,要記得抽時間學習下。 Add Qt versions https://doc.qt.io/qtvstools/qtvstools-how-to-add-qt-versions.html B…

【系統分析師】第21章-論文:系統分析師論文寫作要點(核心總結)

更多內容請見: 備考系統分析師-專欄介紹和目錄 文章目錄 一、寫作注意事項:構建論文的合規性與專業性 1.1 加強學習 1.2 平時積累 1.3 提高打字速度 1.4 以不變應萬變 二、試題解答方法:結構化應對策略 2.1 試題類型分析 2.2 三段式答題框架 2.3 時間分配 三、論文寫作方法:…

tailwindcss 究竟比 unocss 快多少?

tailwindcss 究竟比 unocss 快多少? 前言 大家好,我是去年一篇測評 《unocss 究竟比 tailwindcss 快多少?》 的作者 icebreaker。 一晃到了 2025 年,tailwindcss4 也正式發布了,現在最新版本是 4.1.13。 新版本不僅…

算法練習——55.跳躍游戲

1.題目描述給你一個非負整數數組 nums ,你最初位于數組的 第一個下標 。數組中的每個元素代表你在該位置可以跳躍的最大長度。判斷你是否能夠到達最后一個下標,如果可以,返回 true ;否則,返回 false 。示例 1&#xff…

Django 項目6:表單與認證系統

目錄 1、form 表單 2、session 保存狀態 3、Admin 后臺 4、Auth 系統 1、form 表單 (1)創建 form.py 文件,并完善 from django import forms# 定義一個表單類 class Register(forms.Form):user forms.CharField(max_length30, label用…

tvm/triton/tensorrt比較

1.tvm的主線感覺更新太慢,文檔太落后,在自動駕駛領域不支持Blackwell平臺,跨平臺其實吹牛的更多。我覺得自動駕駛用不起來。2.性能最快的還是tensorrt/tensorrt_llm這條路,純cuda路線面臨大量cuda算子開發,比如vllm ll…

Transform 和BERT、GPT 模型

目錄 Transform的由來 Seq2seq 模型 Transform 的內部結構 語言模型 BERT 介紹 BERT 模型的組成 分詞器 位置編碼 Softmax 殘差結構 BERT 模型總結 Transform的由來 傳統的語?模型,?如RNN(循環神經?絡),就像?個“短…

2025高教社國賽數學建模A題參考論文35頁(含代碼和模型)

2025國賽數學建模競賽A題完整參考論文 目錄 摘要 1 問題背景與重述 2 問題分析 2.1 問題一分析 2.2 問題二分析 2.3 問題三分析 2.4 問題四分析 2.5 問題五分析 3 符號說明 4 模型假設 5 模型建立與求解 5.1 問題一 煙幕有效遮蔽時長…

【Linux】常用命令匯總

【Linux】常用命令【一】tar命令【1】可用參數【2】常用案例(1)創建歸檔(打包)(2)查看歸檔內容:??(3)解包歸檔 (提取):??【二】日志查看命令【1】基礎命令…

軟考系統架構設計師之軟件系統建模

一、軟件系統建模 系統建模流程包括如下: 二、人機交互設計 黃金三法則: 1、置于用戶控制之下以不強迫用戶進入不必要的或不希望的動作的方式來定義交互方式 提供靈活的交互 允許用戶交互可以被中斷和撤銷 當技能級別增加時可以使交互流水化并允許定制交…