Linux安裝Tesseract-OCR
- 第一步,安裝依賴
- 第二步,下載安裝包
- 第三步,安裝leptonica庫
- 第四步,安裝tesseract
- 第五步,添加語言包
- 第六步,測試
第一步,安裝依賴
sudo yum install libpng-devel
rpm -qa | grep libpng-devel
sudo yum install libjpeg-devel
rpm -qa | grep libjpeg-devel
sudo yum install tiff-devel
rpm -qa | grep tiff-devel
sudo yum install libtool-ltdl
rpm -qa | grep libtool-ltdl
sudo yum install gcc
gcc --version
sudo yum install g++
g++ --version
sudo yum install automake
automake --version
第二步,下載安裝包
leptonica-1.78.0.tar.gz
下載地址 http://www.leptonica.org/source/leptonica-1.78.0.tar.gz
tesseract-5.2.0.tar.gz
下載地址 https://codeload.github.com/tesseract-ocr/tesseract/tar.gz/refs/tags/5.2.0
第三步,安裝leptonica庫
#1、首先,使用tar命令解壓leptonica-1.78.0.tar.gz文件。這個命令會將壓縮包中的所有文件和目錄提取到當前目錄下
tar -xzvf leptonica-1.78.0.tar.gz#2、然后,進入解壓后的目錄leptonica-1.78.0
cd leptonica-1.78.0#3、./autogen.sh是一個用于生成Makefile文件的腳本。它會根據系統的環境和配置信息,自動生成適合當前環境的Makefile文件,以便進行編譯和安裝。通常在源代碼包中提供該腳本,用戶需要先運行該腳本,然后再執行make命令進行編譯和安裝。
./autogen.sh
【如果執行autogen.sh腳本提示libtoolize: 未找到命令,執行sudo yum install libtool】#4、接下來,執行configure命令進行配置
./configure --prefix=/usr/local/leptonica#5、配置完成后,執行make命令進行編譯
make#6、最后,使用sudo make install命令進行安裝。這個命令需要管理員權限,因為安裝軟件通常需要修改系統文件。
sudo make install接下來配置 leptonica 環境變量
#1、打開 /etc/profile
vim /etc/profile#2、追加以下字段
PKG_CONFIG_PATH=$PKG_CONFIG_PATH:/usr/local/leptonica/lib/pkgconfig
export PKG_CONFIG_PATH
CPLUS_INCLUDE_PATH=$CPLUS_INCLUDE_PATH:/usr/local/leptonica/include/leptonica
export CPLUS_INCLUDE_PATH
C_INCLUDE_PATH=$C_INCLUDE_PATH:/usr/local/leptonica/include/leptonica
export C_INCLUDE_PATH
LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/leptonica/lib
export LD_LIBRARY_PATH
LIBRARY_PATH=$LIBRARY_PATH:/usr/local/leptonica/lib
export LIBRARY_PATH
LIBLEPT_HEADERSDIR=/usr/local/leptonica/include/leptonica
export LIBLEPT_HEADERSDIR#3、應用配置
source /etc/profile
第四步,安裝tesseract
#1、首先,使用tar命令解壓tesseract-5.2.0.tar.gz文件。這個命令會將壓縮包中的所有文件和目錄提取到當前目錄下。
tar -xzvf tesseract-5.2.0.tar.gz#2、然后,進入解壓后的目錄tesseract-5.2.0.tar.gz
cd tesseract-5.2.0#3、./autogen.sh是一個用于生成Makefile文件的腳本。它會根據系統的環境和配置信息,自動生成適合當前環境的Makefile文件,以便進行編譯和安裝。通常在源代碼包中提供該腳本,用戶需要先運行該腳本,然后再執行make命令進行編譯和安裝。
./autogen.sh#4、執行configure命令進行配置(這步可能會提示報錯,看看自己缺少什么依賴就安裝什么依賴)
./configure --prefix=/usr/local/tesseract#5、配置完成后,執行make命令進行編譯
配置完成后,執行make命令進行編譯
make#6.最后,使用sudo make install命令進行安裝。這個命令需要管理員權限,因為安裝軟件通常需要修改系統文件
sudo make install接下來配置 tesseract 環境變量
#1、打開 /etc/profile
vim /etc/profile#2、追加以下字段
PATH=$PATH:/usr/local/tesseract/bin
export PATH
export TESSDATA_PREFIX=/usr/local/share/tessdata
#export PATH=$PATH:$TESSDATA_PREFIX#3、應用配置
source /etc/profile#4、測試一下
tesseract -v
第五步,添加語言包
#1、如果你不想每次都指定語言包加載路徑的話...你需要: 將軟件安裝目錄下的 tessdata目錄 拷貝到 /usr/local/share/tessdata目錄#2、下載 tesseract 語言包(從你win系統里面的C:\Program Files\Tesseract-OCR\tessdata里面的語言包拷貝到Linux服務器上/usr/local/share/tessdata目錄就可以了,因為這樣操作是最安全的,不然會出現奇奇怪怪的問題等待你處理,因為你下載的語言包不一定是正確的。)ps:前提是你的win安裝了tesseract,并且在安裝的時候選擇了安裝語言包
第六步,測試
識別圖片命令
tesseract 567.png outputteee -l chi_sim+eng參數說明
tesseract = 命令
567.png=當前目錄文件
outputteee=會在當前目錄生成outputteee.txt文件
-l chi_sim+eng=中文+英文,如果是單個語言-l chi_sim就可以了