一、思路分析
大體思路:首先拿到一張銀行卡,我們得有銀行卡號數字的0-9樣式的模板,然后再通過不同數字的輪廓的外接矩形來進行匹配,最終識別出銀行卡號所對應的數字。
銀行卡數字模板:
銀行卡信息:
拿到銀行卡的時候,因為銀行卡上面不僅僅只是銀行卡號,還會存在一些干擾項,這時候需要對這些干擾項進行過濾,這些干擾項和數字所在的外接輪廓大小是不相同的,故可以以此進行過濾篩選。當然,一下次不會將單個數字給定位到,拿到的也不是單個數字,絕大多數的銀行卡號都是四個為一組,接下來再對每一組中的四個數字進行拆分。
二、導包以及相關函數
from imutils import contours
import numpy as np
import argparse
import cv2
# 繪圖展示
def cv_show(name,img):cv2.imshow(name, img)cv2.waitKey(0)cv2.destroyAllWindows()
#因為銀行卡分為四個大輪廓,每個大輪廓中又包括四個數字,這里需要定義一個函數用于將識別出的四個大輪廓依次排序存放
def sort_contours(cnts, method="left-to-right"):reverse = Falsei = 0if method == "right-to-left" or method == "bottom-to-top":reverse = Trueif method == "top-to-bottom" or method == "bottom-to-top":i = 1boundingBoxes = [cv2.boundingRect(c) for c in cnts] #用一個最小的矩形,把找到的形狀包起來x,y,h,w(cnts, boundingBoxes) = zip(*sorted(zip(cnts, boundingBoxes),key=lambda b: b[1][i], reverse=reverse))#對模板上的輪廓進行排序,也就是將模板上的數字給貼個標簽return cnts, boundingBoxes#返回輪廓以及輪廓信息一個列表
#因為銀行卡數字這塊圖像會較小,需要重新指定一下圖像大小
def resize(image, width=None, height=None, inter=cv2.INTER_AREA):dim = None(h, w) = image.shape[:2]if width is None and height is None:return imageif width is None:r = height / float(h)dim = (int(w * r), height)else:r = width / float(w)dim = (width, int(h * r))resized = cv2.resize(image, dim, interpolation=inter)return resized
三、獲取模板上的數字信息
指定測試圖像以及模板圖像位置
# 設置參數
ap = argparse.ArgumentParser()
ap.add_argument("-i", "--image", required=True,help="path to input image")#指定輸入圖像
ap.add_argument("-t", "--template", required=True,help="path to template OCR-A image")#指定模板圖像
args = vars(ap.parse_args())
設置銀行卡類型參數
# 指定信用卡類型
FIRST_NUMBER = {"3": "American Express","4": "Visa","5": "MasterCard","6": "Discover Card"
}
首先處理模板圖像,模板圖像存放這0-9數字,讀取模板圖像,灰度圖、二值化
# 讀取一個模板圖像
img = cv2.imread(args["template"])
cv_show('img',img)
# 灰度圖
ref = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
cv_show('ref',ref)
# 二值圖像
ref = cv2.threshold(ref, 10, 255, cv2.THRESH_BINARY_INV)[1]
cv_show('ref',ref)
對二值化之后的模板圖像獲取輪廓
# 計算輪廓
#cv2.findContours()函數接受的參數為二值圖,即黑白的(不是灰度圖),cv2.RETR_EXTERNAL只檢測外輪廓,cv2.CHAIN_APPROX_SIMPLE只保留終點坐標
#返回的list中每個元素都是圖像中的一個輪廓
ref_, refCnts, hierarchy = cv2.findContours(ref.copy(), cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
用紅色線進行繪制模板輪廓,定義一個空字典digits,用于存儲后續得到模板圖像輪廓信息
cv2.drawContours(img,refCnts,-1,(0,0,255),3) #用紅色線畫輪廓
cv_show('img',img)
print (np.array(refCnts).shape)#出現10個輪廓,0-9數字所對應的圖像信息
refCnts = sort_contours(refCnts, method="left-to-right")[0] #排序,從左到右,從上到下 得到模板排序完之后的輪廓
digits = {}#指定一個空字典
對模板圖像中0-9個輪廓依次去遍歷,得到信息存儲到digits字典中
# 遍歷每一個輪廓
for (i, c) in enumerate(refCnts):#在模板輪廓中不斷的去遍歷,i為輪廓的索引,c為輪廓# 計算外接矩形并且resize成合適大小(x, y, w, h) = cv2.boundingRect(c)#得到第i個輪廓的外接矩形信息roi = ref[y:y + h, x:x + w]#用外接矩形對模板圖像相同位置摳出來roi = cv2.resize(roi, (57, 88))#摳出來的模板圖像的大小可能會較小,把圖像給resize成一個差不多大小的圖像# 每一個數字對應每一個模板digits[i] = roi#把從模板中摳出來的數字存入到字典中,模板為value,索引為key
#循環結束之后,digits字典中就存放有了0-9數字的模板圖像信息
三、對測試圖像進行形態學操作,消除其他的干擾因素
根據不同情景選取合適的卷積核
# 初始化卷積核 這里主要是根據具體情況具體分析 卷積核的定義需要看具體情況而定
rectKernel = cv2.getStructuringElement(cv2.MORPH_RECT, (9, 3))
sqKernel = cv2.getStructuringElement(cv2.MORPH_RECT, (5, 5))
對測試圖像進行預處理操作
#讀取輸入圖像,預處理
image = cv2.imread(args["image"])#讀取測試圖片
cv_show('image',image)#顯示一下測試圖像
image = resize(image, width=300)#重新resize一下圖像大小
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)#因為傳入的測試圖像是彩色圖,需要轉換為灰度圖
cv_show('gray',gray)#顯示一下灰度圖
將得到的灰度圖圖像通過禮帽操作,使得數字特征信息更加明顯
#禮帽操作,突出更明亮的區域
tophat = cv2.morphologyEx(gray, cv2.MORPH_TOPHAT, rectKernel)
cv_show('tophat',tophat)
gradX = cv2.Sobel(tophat, ddepth=cv2.CV_32F, dx=1, dy=0, ksize=-1)#ksize=-1相當于用3*3的
gradX = np.absolute(gradX)
(minVal, maxVal) = (np.min(gradX), np.max(gradX))
gradX = (255 * ((gradX - minVal) / (maxVal - minVal)))
gradX = gradX.astype("uint8")print (np.array(gradX).shape)
cv_show('gradX',gradX)
將數字部分進行融合到一塊,分成四個大輪廓
#通過閉操作(先膨脹,再腐蝕)將數字連在一起
gradX = cv2.morphologyEx(gradX, cv2.MORPH_CLOSE, rectKernel)
cv_show('gradX',gradX)
#THRESH_OTSU會自動尋找合適的閾值,適合雙峰,需把閾值參數設置為0
thresh = cv2.threshold(gradX, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
cv_show('thresh',thresh)#因為實際效果并不好,沒有完全融合到一塊,故再來一個閉操作
thresh = cv2.morphologyEx(thresh, cv2.MORPH_CLOSE, sqKernel) #再來一個閉操作
cv_show('thresh',thresh)
繪制測試圖像中的輪廓信息
# 計算輪廓
thresh_, threshCnts, hierarchy = cv2.findContours(thresh.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)cnts = threshCnts
cur_img = image.copy()
cv2.drawContours(cur_img,cnts,-1,(0,0,255),3) #將處理之后的圖像輪廓繪制到原始圖像中去
cv_show('img',cur_img)
locs = []#因為對測試圖像輪廓檢測會得到很多個輪廓,其中只有數字部分輪廓是我們需要的,這里定義一個列表,用于存儲我們需要的數字輪廓
四、開始將測試圖像與模板圖像數字輪廓依次進行比較
因為測試圖像中的輪廓會有好多,我們只需要數字輪廓部分,故圖像輪廓的寬高比進行篩選
# 遍歷輪廓
for (i, c) in enumerate(cnts):# 計算矩形(x, y, w, h) = cv2.boundingRect(c)#繪制外接矩形ar = w / float(h)#算出寬高比比例,根據不同的比例篩選我們需要的數字輪廓# 選擇合適的區域,根據實際任務來,這里的基本都是四個數字一組if ar > 2.5 and ar < 4.0:#銀行卡上一般都是四個字為一組為一個輪廓,這個輪廓的寬高比是有個取值范圍的,通過這個范圍進行篩選我們需要的數字輪廓if (w > 40 and w < 55) and (h > 10 and h < 20):#符合的留下來locs.append((x, y, w, h))#將符合我們所設定的輪廓進行存儲,這些都是四個數字為一組,一共有四組輪廓信息
將篩選之后得出的輪廓進行排序存放
# 將符合的輪廓從左到右排序
locs = sorted(locs, key=lambda x:x[0])#對獲取的大輪廓從左到右排序
output = []
遍歷每個輪廓中的數字信息與模板中的數字信息比較評分
# 遍歷每一個輪廓中的數字
for (i, (gX, gY, gW, gH)) in enumerate(locs):# initialize the list of group digitsgroupOutput = []# 根據坐標提取每一個組group = gray[gY - 5:gY + gH + 5, gX - 5:gX + gW + 5]#為了使得效果處理較好,將拿到的大輪廓數據往上往下往左往右都擴大點cv_show('group',group)#顯示第i個大輪廓# 預處理group = cv2.threshold(group, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]#對第i個大輪廓二值化,為了找大輪廓中的四個數字輪廓cv_show('group',group)# 計算每一組的輪廓group_,digitCnts,hierarchy = cv2.findContours(group.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)#對第i個大輪廓依次進行輪廓檢測digitCnts = contours.sort_contours(digitCnts,method="left-to-right")[0]#對檢測出來的小輪廓從左到右排序# 計算每一組中的每一個數值for c in digitCnts:#每個大輪廓都有四個數字,對每一個大輪廓中的每一個小數字分別進行計算,此時c有4個值,因為測試圖像中有每個大輪廓有四個數字# 找到當前數值的輪廓,resize成合適的的大小(x, y, w, h) = cv2.boundingRect(c)#對大輪廓找取外接輪廓roi = group[y:y + h, x:x + w]#找到每個數字的輪廓信息roi = cv2.resize(roi, (57, 88))#這個resize的參數要與上列的模板設定的大小一致,到時候需要做模板匹配大小應該一致cv_show('roi',roi)#依次展示第i個大輪廓中的四個數字# 計算匹配得分scores = []#得到數字輪廓信息,要對模板進行比較,存儲得分信息# 在模板中計算每一個得分for (digit, digitROI) in digits.items():#將這個數字模板依次與標準模板中的十個數進行匹配# 模板匹配result = cv2.matchTemplate(roi, digitROI, cv2.TM_CCOEFF)(_, score, _, _) = cv2.minMaxLoc(result)scores.append(score)#依次將得分信息存入# 得到最合適的數字groupOutput.append(str(np.argmax(scores)))#選出得分最高的那個數即可# 畫出來cv2.rectangle(image, (gX - 5, gY - 5), (gX + gW + 5, gY + gH + 5), (0, 0, 255), 1)cv2.putText(image, "".join(groupOutput), (gX, gY - 15), cv2.FONT_HERSHEY_SIMPLEX, 0.65, (0, 0, 255), 2)# 得到結果output.extend(groupOutput)#得到第c組大輪廓的四個數
五、輸出展示
# 打印結果
print("Credit Card Type: {}".format(FIRST_NUMBER[output[0]]))
print("Credit Card #: {}".format("".join(output)))
cv2.imshow("Image", image)
cv2.waitKey(0)
六、Pycharm參數設定方法
找到Edit Configurations
--image images/credit_card_04.png --template ocr_a_reference.png
其中:images/credit_card_04.png為測試圖片的位置、ocr_a_reference.png為銀行卡數字模板圖片的位置
七、項目完整代碼
# 導入工具包
from imutils import contours
import numpy as np
import argparse
import cv2
#import myutils# 設置參數
ap = argparse.ArgumentParser()
ap.add_argument("-i", "--image", required=True,help="path to input image")#指定輸入圖像
ap.add_argument("-t", "--template", required=True,help="path to template OCR-A image")#指定模板圖像
args = vars(ap.parse_args())# 指定信用卡類型
FIRST_NUMBER = {"3": "American Express","4": "Visa","5": "MasterCard","6": "Discover Card"
}
# 繪圖展示
def cv_show(name,img):cv2.imshow(name, img)cv2.waitKey(0)cv2.destroyAllWindows()def sort_contours(cnts, method="left-to-right"):reverse = Falsei = 0if method == "right-to-left" or method == "bottom-to-top":reverse = Trueif method == "top-to-bottom" or method == "bottom-to-top":i = 1boundingBoxes = [cv2.boundingRect(c) for c in cnts] #用一個最小的矩形,把找到的形狀包起來x,y,h,w(cnts, boundingBoxes) = zip(*sorted(zip(cnts, boundingBoxes),key=lambda b: b[1][i], reverse=reverse))#對模板上的輪廓進行排序,也就是將模板上的數字給貼個標簽return cnts, boundingBoxes#返回輪廓以及輪廓信息一個列表def resize(image, width=None, height=None, inter=cv2.INTER_AREA):dim = None(h, w) = image.shape[:2]if width is None and height is None:return imageif width is None:r = height / float(h)dim = (int(w * r), height)else:r = width / float(w)dim = (width, int(h * r))resized = cv2.resize(image, dim, interpolation=inter)return resized# 讀取一個模板圖像
img = cv2.imread(args["template"])
cv_show('img',img)
# 灰度圖
ref = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
cv_show('ref',ref)
# 二值圖像
ref = cv2.threshold(ref, 10, 255, cv2.THRESH_BINARY_INV)[1]
cv_show('ref',ref)# 計算輪廓
#cv2.findContours()函數接受的參數為二值圖,即黑白的(不是灰度圖),cv2.RETR_EXTERNAL只檢測外輪廓,cv2.CHAIN_APPROX_SIMPLE只保留終點坐標
#返回的list中每個元素都是圖像中的一個輪廓
ref_, refCnts, hierarchy = cv2.findContours(ref.copy(), cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)cv2.drawContours(img,refCnts,-1,(0,0,255),3) #用紅色線畫輪廓
cv_show('img',img)
print (np.array(refCnts).shape)#出現十個輪廓
refCnts = sort_contours(refCnts, method="left-to-right")[0] #排序,從左到右,從上到下 得到模板排序完之后的輪廓
digits = {}#指定一個空字典# 遍歷每一個輪廓
for (i, c) in enumerate(refCnts):#在模板輪廓中不斷的去遍歷,i為輪廓的索引,c為輪廓# 計算外接矩形并且resize成合適大小(x, y, w, h) = cv2.boundingRect(c)#得到第i個輪廓的外接矩形信息roi = ref[y:y + h, x:x + w]#用外接矩形對模板圖像相同位置摳出來roi = cv2.resize(roi, (57, 88))#摳出來的模板圖像的大小可能會較小,把圖像給resize成一個差不多大小的圖像# 每一個數字對應每一個模板digits[i] = roi#把從模板中摳出來的數字存入到字典中,模板為value,索引為key
#循環結束之后,digits字典中就存放有了0-9數字的模板圖像信息# 初始化卷積核
rectKernel = cv2.getStructuringElement(cv2.MORPH_RECT, (9, 3))
sqKernel = cv2.getStructuringElement(cv2.MORPH_RECT, (5, 5))#讀取輸入圖像,預處理
image = cv2.imread(args["image"])#讀取測試圖片
cv_show('image',image)#顯示一下測試圖像
image = resize(image, width=300)#重新resize一下圖像大小
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)#因為傳入的測試圖像是彩色圖,需要轉換為灰度圖
cv_show('gray',gray)#顯示一下灰度圖#禮帽操作,突出更明亮的區域
tophat = cv2.morphologyEx(gray, cv2.MORPH_TOPHAT, rectKernel)
cv_show('tophat',tophat)
#
gradX = cv2.Sobel(tophat, ddepth=cv2.CV_32F, dx=1, dy=0, ksize=-1)#ksize=-1相當于用3*3的gradX = np.absolute(gradX)
(minVal, maxVal) = (np.min(gradX), np.max(gradX))
gradX = (255 * ((gradX - minVal) / (maxVal - minVal)))
gradX = gradX.astype("uint8")print (np.array(gradX).shape)
cv_show('gradX',gradX)#通過閉操作(先膨脹,再腐蝕)將數字連在一起
gradX = cv2.morphologyEx(gradX, cv2.MORPH_CLOSE, rectKernel)
cv_show('gradX',gradX)
#THRESH_OTSU會自動尋找合適的閾值,適合雙峰,需把閾值參數設置為0
thresh = cv2.threshold(gradX, 0, 255,cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
cv_show('thresh',thresh)#再來一個閉操作
thresh = cv2.morphologyEx(thresh, cv2.MORPH_CLOSE, sqKernel) #再來一個閉操作
cv_show('thresh',thresh)# 計算輪廓
thresh_, threshCnts, hierarchy = cv2.findContours(thresh.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)cnts = threshCnts
cur_img = image.copy()
cv2.drawContours(cur_img,cnts,-1,(0,0,255),3) #將處理之后的圖像輪廓繪制到原始圖像中去
cv_show('img',cur_img)
locs = []#因為對測試圖像輪廓檢測會得到很多個輪廓,其中只有數字部分輪廓是我們需要的,這里定義一個列表,用于存儲我們需要的數字輪廓# 遍歷輪廓
for (i, c) in enumerate(cnts):# 計算矩形(x, y, w, h) = cv2.boundingRect(c)#繪制外接矩形ar = w / float(h)#算出寬高比比例,根據不同的比例篩選我們需要的數字輪廓# 選擇合適的區域,根據實際任務來,這里的基本都是四個數字一組if ar > 2.5 and ar < 4.0:#銀行卡上一般都是四個字為一組為一個輪廓,這個輪廓的寬高比是有個取值范圍的,通過這個范圍進行篩選我們需要的數字輪廓if (w > 40 and w < 55) and (h > 10 and h < 20):#符合的留下來locs.append((x, y, w, h))#將符合我們所設定的輪廓進行存儲,這些都是四個數字為一組,一共有四組輪廓信息# 將符合的輪廓從左到右排序
locs = sorted(locs, key=lambda x:x[0])#對獲取的大輪廓從左到右排序
output = []# 遍歷每一個輪廓中的數字
for (i, (gX, gY, gW, gH)) in enumerate(locs):# initialize the list of group digitsgroupOutput = []# 根據坐標提取每一個組group = gray[gY - 5:gY + gH + 5, gX - 5:gX + gW + 5]#為了使得效果處理較好,將拿到的大輪廓數據往上往下往左往右都擴大點cv_show('group',group)#顯示第i個大輪廓# 預處理group = cv2.threshold(group, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]#對第i個大輪廓二值化,為了找大輪廓中的四個數字輪廓cv_show('group',group)# 計算每一組的輪廓group_,digitCnts,hierarchy = cv2.findContours(group.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)#對第i個大輪廓依次進行輪廓檢測digitCnts = contours.sort_contours(digitCnts,method="left-to-right")[0]#對檢測出來的小輪廓從左到右排序# 計算每一組中的每一個數值for c in digitCnts:#每個大輪廓都有四個數字,對每一個大輪廓中的每一個小數字分別進行計算,此時c有4個值,因為測試圖像中有每個大輪廓有四個數字# 找到當前數值的輪廓,resize成合適的的大小(x, y, w, h) = cv2.boundingRect(c)#對大輪廓找取外接輪廓roi = group[y:y + h, x:x + w]#找到每個數字的輪廓信息roi = cv2.resize(roi, (57, 88))#這個resize的參數要與上列的模板設定的大小一致,到時候需要做模板匹配大小應該一致cv_show('roi',roi)#依次展示第i個大輪廓中的四個數字# 計算匹配得分scores = []#得到數字輪廓信息,要對模板進行比較,存儲得分信息# 在模板中計算每一個得分for (digit, digitROI) in digits.items():#將這個數字模板依次與標準模板中的十個數進行匹配# 模板匹配result = cv2.matchTemplate(roi, digitROI, cv2.TM_CCOEFF)(_, score, _, _) = cv2.minMaxLoc(result)scores.append(score)#依次將得分信息存入# 得到最合適的數字groupOutput.append(str(np.argmax(scores)))#選出得分最高的那個數即可# 畫出來cv2.rectangle(image, (gX - 5, gY - 5), (gX + gW + 5, gY + gH + 5), (0, 0, 255), 1)cv2.putText(image, "".join(groupOutput), (gX, gY - 15), cv2.FONT_HERSHEY_SIMPLEX, 0.65, (0, 0, 255), 2)# 得到結果output.extend(groupOutput)#得到第c組大輪廓的四個數# 打印結果
print("Credit Card Type: {}".format(FIRST_NUMBER[output[0]]))
print("Credit Card #: {}".format("".join(output)))
cv2.imshow("Image", image)
cv2.waitKey(0)
八、測試圖片和模板圖片
模板圖像:
測試圖像:
九、運行效果展示