最近學習,很多東西都是視頻,截圖后,又想做成文檔保存起來。
剛開始不多,打一下字就很快解決了。
隨著時間的推移,現在越來越多的圖了,管理起來確實不方便,打字有時也不能很快的解決。
所以就弄了個OCR。
1、首先??pip install baidu-aip
2、去注冊個百度去帳號,然后那個OCR的API,獲得APP ID,API KEY,API SECRET KEY
3,把程序里
APP_ID = 'YOUR APP ID'
API_KEY = 'YOUR API KEY'
SECRET_KEY = 'YOUR SECRET KEY'
修改成你在百度獲得到APP ID,API KEY,API SECRET KEY,
相關百度的文字識別,請參考百度OCR網址:https://ai.baidu.com/ai-doc/OCR/fk3h7xune
4,修改path = "YOUR PATH"? #YOUR PATH? 如D:\picture\ocr_picture
# -*- coding:utf-8 -*-
import osdef get_image(path):"""這里可以取到文件夾下全部的jpg與png的圖像"""path_name = pathfiles = os.listdir(path_name)file_name_with_path = []for file in files:if os.path.splitext(file)[1] == '.png' or '.jpg':file_name_with_path.append(os.path.join(path, file))
# print(os.path.join(path, file))return file_name_with_pathfrom aip import AipOcr
APP_ID = 'YOUR APP ID'
API_KEY = 'YOUR API KEY'
SECRET_KEY = 'YOUR SECRET KEY'client = AipOcr(APP_ID, API_KEY, SECRET_KEY)""" 讀取圖片 """
def get_file_content(filePath):with open(filePath, 'rb') as fp:return fp.read()def ocr_image(image_with_path):""" 調用通用文字識別, 圖片參數為本地圖片 """image = get_file_content(image_with_path)client.basicGeneral(image)""" 帶參數調用通用文字識別, 圖片參數為本地圖片 """# ocr_result 返回的是jason格式,是一個字典ocr_result = client.basicGeneral(image,) # 解析識別的文字ocr_words = ocr_result["words_result"]for i in range(len(ocr_words)):print(ocr_words[i]['words'])path = "YOUR PATH" #YOUR PATH 如D:\picture\ocr_picture
images = get_image(path)
for image in images:ocr_image(image)
這是要識別的圖像,
這是識別的結果,還不錯。基本沒有錯的。