Linux安裝Tesseract-OCR(操作系統CentOS)

Linux安裝Tesseract-OCR

  • 第一步,安裝依賴
  • 第二步,下載安裝包
  • 第三步,安裝leptonica庫
  • 第四步,安裝tesseract
  • 第五步,添加語言包
  • 第六步,測試

第一步,安裝依賴

sudo yum install libpng-devel
rpm -qa | grep libpng-devel
sudo yum install libjpeg-devel
rpm -qa | grep libjpeg-devel
sudo yum install tiff-devel
rpm -qa | grep tiff-devel
sudo yum install libtool-ltdl
rpm -qa | grep libtool-ltdl
sudo yum install gcc
gcc --version
sudo yum install g++
g++ --version
sudo yum install automake
automake --version

第二步,下載安裝包

leptonica-1.78.0.tar.gz
下載地址 http://www.leptonica.org/source/leptonica-1.78.0.tar.gz

tesseract-5.2.0.tar.gz
下載地址 https://codeload.github.com/tesseract-ocr/tesseract/tar.gz/refs/tags/5.2.0

第三步,安裝leptonica庫

#1、首先,使用tar命令解壓leptonica-1.78.0.tar.gz文件。這個命令會將壓縮包中的所有文件和目錄提取到當前目錄下
tar -xzvf leptonica-1.78.0.tar.gz#2、然后,進入解壓后的目錄leptonica-1.78.0
cd leptonica-1.78.0#3、./autogen.sh是一個用于生成Makefile文件的腳本。它會根據系統的環境和配置信息,自動生成適合當前環境的Makefile文件,以便進行編譯和安裝。通常在源代碼包中提供該腳本,用戶需要先運行該腳本,然后再執行make命令進行編譯和安裝。
./autogen.sh
【如果執行autogen.sh腳本提示libtoolize: 未找到命令,執行sudo yum install libtool】#4、接下來,執行configure命令進行配置
./configure --prefix=/usr/local/leptonica#5、配置完成后,執行make命令進行編譯
make#6、最后,使用sudo make install命令進行安裝。這個命令需要管理員權限,因為安裝軟件通常需要修改系統文件。
sudo make install接下來配置 leptonica 環境變量
#1、打開 /etc/profile
vim /etc/profile#2、追加以下字段
PKG_CONFIG_PATH=$PKG_CONFIG_PATH:/usr/local/leptonica/lib/pkgconfig
export PKG_CONFIG_PATH
CPLUS_INCLUDE_PATH=$CPLUS_INCLUDE_PATH:/usr/local/leptonica/include/leptonica
export CPLUS_INCLUDE_PATH
C_INCLUDE_PATH=$C_INCLUDE_PATH:/usr/local/leptonica/include/leptonica
export C_INCLUDE_PATH
LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/leptonica/lib
export LD_LIBRARY_PATH
LIBRARY_PATH=$LIBRARY_PATH:/usr/local/leptonica/lib
export LIBRARY_PATH
LIBLEPT_HEADERSDIR=/usr/local/leptonica/include/leptonica
export LIBLEPT_HEADERSDIR#3、應用配置
source /etc/profile

第四步,安裝tesseract

#1、首先,使用tar命令解壓tesseract-5.2.0.tar.gz文件。這個命令會將壓縮包中的所有文件和目錄提取到當前目錄下。
tar -xzvf tesseract-5.2.0.tar.gz#2、然后,進入解壓后的目錄tesseract-5.2.0.tar.gz
cd tesseract-5.2.0#3、./autogen.sh是一個用于生成Makefile文件的腳本。它會根據系統的環境和配置信息,自動生成適合當前環境的Makefile文件,以便進行編譯和安裝。通常在源代碼包中提供該腳本,用戶需要先運行該腳本,然后再執行make命令進行編譯和安裝。
./autogen.sh#4、執行configure命令進行配置(這步可能會提示報錯,看看自己缺少什么依賴就安裝什么依賴)
./configure --prefix=/usr/local/tesseract#5、配置完成后,執行make命令進行編譯
配置完成后,執行make命令進行編譯
make#6.最后,使用sudo make install命令進行安裝。這個命令需要管理員權限,因為安裝軟件通常需要修改系統文件
sudo make install接下來配置 tesseract 環境變量
#1、打開 /etc/profile
vim /etc/profile#2、追加以下字段
PATH=$PATH:/usr/local/tesseract/bin
export PATH
export TESSDATA_PREFIX=/usr/local/share/tessdata
#export PATH=$PATH:$TESSDATA_PREFIX#3、應用配置
source /etc/profile#4、測試一下
tesseract -v

第五步,添加語言包

#1、如果你不想每次都指定語言包加載路徑的話...你需要: 將軟件安裝目錄下的 tessdata目錄 拷貝到 /usr/local/share/tessdata目錄#2、下載 tesseract 語言包(從你win系統里面的C:\Program Files\Tesseract-OCR\tessdata里面的語言包拷貝到Linux服務器上/usr/local/share/tessdata目錄就可以了,因為這樣操作是最安全的,不然會出現奇奇怪怪的問題等待你處理,因為你下載的語言包不一定是正確的。)ps:前提是你的win安裝了tesseract,并且在安裝的時候選擇了安裝語言包

第六步,測試

識別圖片命令
tesseract 567.png outputteee -l chi_sim+eng參數說明
tesseract = 命令
567.png=當前目錄文件
outputteee=會在當前目錄生成outputteee.txt文件
-l chi_sim+eng=中文+英文,如果是單個語言-l chi_sim就可以了

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/167039.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/167039.shtml
英文地址,請注明出處:http://en.pswp.cn/news/167039.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

從零學算法400

400.給你一個整數 n ,請你在無限的整數序列 [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, …] 中找出并返回第 n 位上的數字。 示例 1: 輸入:n 3 輸出:3 示例 2: 輸入:n 11 輸出:0 解釋:第…

ubuntu22.04 arrch64版在線安裝mysql8

腳本 # todo參考鏈接 Ubuntu服務器配置mysql8_ubuntu安裝mysql8-CSDN博客

樂得瑞LDR6020 VR串流線方案:實現同時充電傳輸視頻信號

VR(Virtual Reality),俗稱虛擬現實技術,是一項具有巨大潛力的技術創新,正在以驚人的速度改變我們的生活方式和體驗,利用專門設計的設備,如頭戴式顯示器(VR頭盔)、手柄、定…

三菱PLC定時中斷應用編程(計數器+比較器)

三菱PLC如何開啟定時中斷可以查看下面文章鏈接: PLC定時中斷程序應用注意事項(西門子三菱信捷)_plc設置斷點之后會怎樣_RXXW_Dor的博客-CSDN博客文章瀏覽閱讀2.5k次,點贊5次,收藏6次。首先我們了解下什么是中斷。中斷(打斷的意思),在PLC執行當前程序時,由于系統出現了…

抖音推廣實戰,教你如何快速成長

一、背景介紹 隨著移動互聯網的飛速發展,抖音作為一款短視頻平臺,已經成為越來越多人生活中的一部分。它不僅提供了豐富多彩的內容,還為商家提供了推廣產品的絕佳平臺。本文將為大家詳細解析抖音推廣實戰,幫助大家快速成長。 二…

基于SSM的老年公寓信息管理(有報告)。Javaee項目

演示視頻: 基于SSM的老年公寓信息管理(有報告)。Javaee項目 項目介紹: 采用M(model)V(view)C(controller)三層體系結構,通過Spring SpringMvc …

Spring Boot 應用的 Docker 化:從 Maven 構建到 Docker 部署的完整指南

1. 使用Dockerfile部署 # 使用Java 8基礎鏡像 FROM java:8 LABEL authors"mabh"# 設置時區為Asia/Shanghai,可以根據需要更改 ENV TIME_ZONEAsia/Shanghai# 更新時區 RUN ln -snf /usr/share/zoneinfo/$TIME_ZONE /etc/localtime && echo $TIME_…

堆的實現(C語言版)

文章目錄 概述堆的實現初始化銷毀插入刪除取堆頂元素求堆的長度判斷堆是否為空 完整代碼 概述 如果有一個關鍵碼的集合K {k0,k1,k2…kn-1}&#xff0c;把它的所有元素按完全二叉樹的順序存儲方式存儲在一個一維數組中&#xff0c;并滿足&#xff1a;Ki <K2*i1 且 Ki<K2…

Python Opencv實踐 - 全景圖片拼接stitcher

做一個全景圖片切片的程序Spliter 由于手里沒有切割好的全景圖片資源&#xff0c;因此首先寫了一個切片的程序spliter。 如果有現成的切割好的待拼接的切片文件&#xff0c;則不需要使用spliter。 對于全景圖片的拼接&#xff0c;需要注意一點&#xff0c;各個切片圖片之間要有…

NX二次開發UF_CSYS_map_point 函數介紹

文章作者&#xff1a;里海 來源網站&#xff1a;https://blog.csdn.net/WangPaiFeiXingYuan UF_CSYS_map_point Defined in: uf_csys.h int UF_CSYS_map_point(int input_csys, double input_point [ 3 ] , int output_csys, double output_point [ 3 ] ) overview 概述 Ma…

Android11編譯第七彈:串口文件讀寫

問題&#xff1a;需要對SIM卡進行管理&#xff0c;支持APP切換SIM卡。此功能需要訪問串口文件&#xff0c;并且對串口文件進行讀寫。APP操作串口文件/dev/ttyUSB1時&#xff0c;串口文件打開失敗。 2023-11-23 10:59:44.092 14264-14264 MULTI_CARD_SerialHandle com.wellnkio…

三分鐘快速理解 ChatGPT 背后的大模型技術

在過去的十年中&#xff0c;人工智能領域取得了重大突破&#xff0c;其中自然語言處理&#xff08;NLP&#xff09;是其重要子領域之一。NLP使用的模型之一是大型語言模型&#xff08;LLMs&#xff09;。LLMs被設計用于處理大量文本數據&#xff0c;采用先進的神經網絡架構&…

nodejs 文件目錄監聽 chokidar watchpack

文件監聽實現&#xff0c;推薦使用chokidar&#xff1a; chokidar 默認是基于事件監聽文件 const chokidar require("chokidar"); const folderToWatch path.join(__dirname, "lib"); const watcher chokidar.watch(folderToWatch, { ignored: /(^|[…

在Vue中使用Echarts

文章目錄 Echarts1. 介紹2. 體驗NPM 安裝 Echarts定義 Echarts 容器引入 Echarts 3. 基礎配置 Echarts 1. 介紹 常見的數據可視化庫&#xff1a; D3.js 目前 Web 端評價最高的 Javascript 可視化工具庫(入手難)ECharts.js 百度出品的一個開源 Javascript 數據可視化庫Highch…

鼠標拖拽問題,不選中文本不觸發單擊事件

文章目錄 1. 為什么鼠標單擊的時候觸發了mousemove事件&#xff1f;明明鼠標沒有移動2. 鼠標拖拽元素怎么能不觸發單擊事件&#xff1f;怎么處理鼠標在元素內的相對定位&#xff0c;而不是每次定位到左上角&#xff1f;方式一&#xff1a;拖拽的元素沒有注冊click監聽就不會觸發…

10年測試老鳥,自動化測試經驗10條建議,一路狂飆...

目錄&#xff1a;導讀 前言一、Python編程入門到精通二、接口自動化項目實戰三、Web自動化項目實戰四、App自動化項目實戰五、一線大廠簡歷六、測試開發DevOps體系七、常用自動化測試工具八、JMeter性能測試九、總結&#xff08;尾部小驚喜&#xff09; 前言 1、哪一刻&#x…

Java面試題(每天10題)-------連載(37)

目錄 Mysql篇 1、Mysql如何優化DISTINCT&#xff1f; 2、如何輸入字符為十六進制數字&#xff1f; 3、如何顯示前50行&#xff1f; 4、可以使用多少列創建索引&#xff1f; 5、NOW()和CURRENT_DATE()有什么區別&#xff1f; 6、什么樣的對象可以使用CREATE語句創建&…

Postman如何使用(二):Postman Collection的創建/使用/導出分享等

一、什么是Postman Collection&#xff1f; Postman Collection是可讓您將各個請求分組在一起。 您可以將這些請求組織到文件夾中。中文經常將collection翻譯成收藏夾。如果再下文中看到這樣的翻譯不要覺得意外。Postman Collection會使你的工作效率更上一層樓。Postman Colle…

【洛谷 B2080】計算多項式的值 題解(順序結構+四則運算)

計算多項式的值 題目描述 假定多項式的形式為 x n x ( n ? 1 ) x^nx^{(n-1)} xnx(n?1) … x 2 x 1 x^2x1 x2x1&#xff0c;請計算給定單精度浮點數 x x x 和正整數 n n n 值的情況下這個多項式的值。多項式的值精確到小數點后兩位&#xff0c;保證最終結果在 doub…

NFS 速度變慢問題排查 性能優化

NFS 使用 RPC 來進行客戶端和服務器之間的通信。而在 RPC 的底層&#xff0c;NFS 使用 TCP 來進行數據的可靠傳輸&#xff0c;以便客戶端和服務器之間能夠有效地傳輸文件和進行遠程調用&#xff08;默認為TCP,也可調整為udp&#xff09; 1.首先服務器端啟動RPC服務portmap&…