pytesseract：opencv預處理圖片

一、目的

原始圖片用pytesseract識別文字，精準度往往沒達到預期。使用opencv處理后，提高識別精準度。處理方法有

a.圖片轉成白底黑字。

b.截取圖片某固定區域。這個很重要，因為圖片包含圖標或其他形狀圖形，辨識導致錯亂的。

二、opencv 處理

import cv2#加載圖片
image = cv2.imread(filePath)#截取矩形區域
# 格式[y1: y2, x1: x2] , (x1,y1)矩形左上角，(x2,y2)矩形右下角.
image = image[180:550, 55:280]#灰度轉換
GrayImage = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)#二值化   # cv2Type： int類型# 0. cv2.THRESH_BINARY# 表示閾值的二值化操作，大于閾值使用maxval表示，小于閾值使用0表示# # 1. cv2.THRESH_BINARY_INV# 表示閾值的二值化翻轉操作，大于閾值的使用0表示，小于閾值的使用最大值表示# ret, thresh2 = cv2.threshold(GrayImage, 88, 255, cv2.THRESH_BINARY_INV)#cv2Threshold 閾值ret, thresh2 = cv2.threshold(GrayImage, cv2Threshold, 255, cv2Type)#ocr 辨識
# output_type=Output.DICT 將獲取具體辨識數據，用于后期處理。
results = pytesseract.image_to_data(thresh2, output_type=Output.DICT, lang='eng')

寫文字，畫矩形

 for i in range(0, len(results["text"])):text = results["text"][i].strip()tmp_tl_x = results["left"][i]tmp_tl_y = results["top"][i]tmp_br_x = tmp_tl_x + results["width"][i]tmp_br_y = tmp_tl_y + results["height"][i]#寫字cv2.putText(thresh2, text, (tmp_tl_x, tmp_tl_y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 255), 1)#畫矩形cv2.rectangle(image, (tmp_tl_x, tmp_tl_y), (tmp_br_x, tmp_br_y), (0, 255, 255), 2)

參考：https://livezingy.com/pytesseract-image_to_data_locate_text/

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/280488.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/280488.shtml
英文地址，請注明出處：http://en.pswp.cn/news/280488.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！