1.首先準備環境:
python版本:2.7/3.6
操作系統:windows系統
2.準備工具:
tesseract-ocr 安裝后設置好環境變量
鏈接: https://pan.baidu.com/s/1j8lBbQBrrbPaHAn5ujWFSw 提取碼: 2med?
Pycharm
3.安裝相關python包(作者使用的是py3.6)
pip install Pillow
pip install pytesseract
4.使tesseract-ocr與python關聯,從而使python能夠調用Tesseract-OCR程序識別驗證碼/文字:
修改pytesseract.py文件中第35行將tesseract_cmd指向Tesseract-OCR的tesseract.exe
我的是
# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
tesseract_cmd = 'D:/Tesseract/Tesseract-OCR/tesseract.exe'
5.pycharm中程序運行
from PIL import Image
import pytesseract
image = Image.open('1.png')#輸入自己想識別圖片的路徑
# 指定路徑,路徑為安裝的OCR對應的目錄
text = pytesseract.image_to_string(image,) #如果安裝了中文包逗號后可加參數 lang='chi_sim',
print(text)
注意圖片為當前目錄
完成!