OCR是“Optical Character Recognition”的縮寫,中文意思是光學字符識別。這是一種技術,允許電子設備如掃描儀或數碼相機讀取文檔中的文本,通過檢測和分析文本的暗和亮的模式來識別字符的形狀,然后將這些形狀轉換為可被計算機處理的文本格式。
OCR技術主要用于自動化文本數據的錄入,例如將紙質文檔、書籍、報紙、表單或其他印刷材料轉換為數字文本文件。這在文檔管理、數據錄入、圖書館數字化、歷史檔案保護等領域有廣泛應用。隨著人工智能和機器學習的進步,現代OCR軟件的準確性和復雜性都有了顯著提升,能夠處理手寫文本、多語言文本以及復雜的文檔布局。