MATLAB圖像處理
1. 數字圖像處理
參考
數字圖像處理(Digital Image Processing)又稱為計算機圖像處理,是一種將圖像信號數字化利用計算進行處理的過程。隨著計算機科學、電子學和光學的發展,數字圖像處理已經廣泛的應用到諸多領域之中。本小節主要介紹圖像的概念、分類和數字圖像處理的產生以及數字圖像處理的研究的內容。
1.1 什么是圖像
圖像: 是三維世界在二維平面的表示,具體來說就是光學器件對一個物體,一個人或是一個場景等的可視化表示。圖像中包含了它所表達的事物的大部分信息,據有關資料表示,人類所獲得的大部分信息來源于視覺系統,也就是從圖像中獲得的。
1.2 圖像的分類
根據圖像的屬性不同,圖像分類方法也不同。從獲取方式上圖像分為拍攝類圖像和繪制類圖像;從顏色上圖像分為彩色圖像、灰度圖像和黑白圖像等;從圖像的內容上圖像分為人物圖像,風景圖像等;從功能上又分為流程圖、結構圖、心電圖、電路圖、設計圖等。
在數字圖像處理領域,將圖像分為模擬圖像和數字圖像兩種,計算機處理的信號都是數字信號,所以在計算機上處理的圖像均為數字圖像。根據數字圖像在計算機中表示方法不同,分為二進制圖像,索引圖像,灰度圖像,RGB圖像和多幀圖像;根據計算機中圖像文件格式不同,圖像又分為位圖和矢量圖。可見,圖像的屬性是多角度的,圖像的分類也是多維的。
1.3 數字圖像的產生
數字圖像的產生主要有兩種渠道,一種是通過數碼照相機這樣的設備直接拍攝得到數字圖像,還有一種是通過圖像采集卡、掃描儀等數字化設備,將模擬圖像變為數字圖像。
模擬圖像轉換成數字圖像: 首先將圖像分割成8 * 8 個各自,用數字0表示全是黑色,用數字8表示全是白色.(1~7表示黑色的多少)
1.4 數字圖像處理的研究內容
數字圖像處理的研究內容主要有以下方向:
- 圖像運算與變換
-
圖像增強
-
圖像復原
-
圖像的銳化處理及邊緣檢測
-
圖像分割: 將感興趣的區域分割出來,進行研究
-
圖像編碼壓縮
2. 圖像的表示方法
圖像的表示方法是對圖像處理算法描述和利用計算機處理圖形的基礎。一個二維圖像,在計算機中通常為一個二維數組f(x, y), 或者是一個M * N 的二維矩陣,其中, M為圖像的行數, N為圖像的列數。
2.1 二進制圖像
二進制圖像也稱為二值圖像,通常用一個二維數組來描述,1位表示一個像素,組成圖像的像素值非0即1,沒有中間值,通常0表示黑色,1表示白色。二進制圖像一般用來描述文字或者圖形,其優點是占用空間少,缺點是當表示人物或風景圖形時只能描述輪廓。
2.2 灰度圖像
灰度圖像也稱為單色圖像,通常也是由一個二維數組表示一副圖像,8位表示一個像素,0表示黑色,255表示白色,1~254表示不同的深淺灰色。通常灰度圖像顯示了黑色與白色之間許多級的顏色深度,比人眼所能識別的顏色深度范圍要寬的多。
2.3 RGB圖像
RGB圖像也稱為真彩色,是一種彩色圖像的表示方法,利用3個大小相同的二維數組表示一個像素,3個數組分別代表R、G、B三個分量,R表示紅色,G表示綠色,B表示藍色,通過三種基本顏色可以合成任意顏色。每個像素中的每種顏色分量占8位,每一位由[0, 255]中的任意數值表示,那么一個像素由24位表示,允許的最大值為2^24(即1677216,通常記為16M)
2.4 索引圖像
索引圖像是一種把像素值直接作為RGB調色版下標的圖像。在MATLAB中,索引圖像包含一個數據矩陣X和一個顏色映射(調色板)矩陣map。數據矩陣可以是8位無符號整型、16位無符號整型或雙精度類型的。
3. 圖像的數據結構
數字圖像處理常用的數據結構有矩陣,鏈表,拓撲結構和關系結構。圖像的數據結構用于目標表示和描述。本節主要介紹矩陣、鏈表、拓撲結構和關系結構描述圖像、圖像的邊界、區域和區域之間的關系。
3.1 矩陣
矩陣用于描述圖像,可以表示黑白圖像、灰度圖像和彩色圖像。矩陣中的一個元素表示圖像的一個像素。矩陣描述黑白圖像時,矩陣中的元素取值只有0和1兩個值,因此黑白圖像又叫二值圖像或二進制圖像。矩陣描述灰度圖像時,矩陣中的元素由一個量化的灰度級描述,灰度級通常為8位,即0~255之間的整數,其中0表示黑色,255表示白色。
3.2 RGB彩色圖像
RGB彩色圖像是由三原色紅、綠、藍組成的,RGB圖像的每個像素都是由不同灰度級的紅、綠、藍描述的,每種單色的灰度描述同灰度圖像的描述方式相同。
鏈碼用于描述目標圖像的邊界,通過規定鏈的起始坐標和鏈起始點坐標的斜率用一小段線段來表示圖像中的曲線。鏈碼按照標準方向的斜率分為4向鏈碼或8向鏈碼。
3.3 拓撲結構
拓撲結構**用于描述圖像的基本結構,通常在于形態的圖像處理或是二值圖像中,用于描述目標事件發生的次數,在一個目標事件中有多少孔洞,有多少聯通區域等。在圖像中定義相鄰的概念,一個像素與它周圍的像素組成一個鄰域
在圖像中,目標事件上的兩個像素點如果可以用一個像素序列聯通。連接像素p和q的都是4-鄰域像素點,則p和q稱為4-連通,連接p和q的都是8鄰域像素點,則p和q稱為8-連通。如果一個像素集合中的所有像素點都是4連通,則這個集合稱為4-組元,如果一個像素集合的所有像素都是8連通,則這個集合稱為8-組元。
3.4關系結構
關系結構用于描述一組目標物體之間的相互關系,常用的描述方法為傳描述和樹描述。串描述是一種一維結構,當用串描述圖像時,需要建立一種合適的映射關系,將二維圖像降為一維形式。串描述適用于那些圖像元素的鏈表的連接可以用來從頭到尾或用其他連續形式的圖像元素的描述。鏈碼表示就是基于串描述思想描述的。
樹描述:是一種能夠對不連接區域進行很好描述的方法。樹是一個或一個以上節點的有限集合
4. 計算機中圖像文件格式
數字圖像在計算機中存儲的格式有多種多樣,每一個文件格式都包括一個頭文件和一個數據文件。頭文件的內容由制作圖像的公司規定,一般包括文件類型、制作時間,文件大小制作人及版本號等信息。文件制作時還涉及到圖像的壓縮和存儲效率等。
4.1 BMP文件格式
BMP文件格式是Windows系統中的一種標準圖像文件格式,支持RGB、索引顏色、灰度和位圖顏色模式。BMP文件一共有兩種類型,設備相關位圖(DDB)和設備無關位圖(DIB)。Windows3.0及以前的BMP文件格式與顯示設備有關,因此把這種BMP文件格式稱為設備相關位圖DDB(device-dependent bitmap)文件格式。Windows3.0 以后的BMP文件與顯示設備無關,因此把這種BMP圖像文件格式稱為與位圖無關DIB(device-independent bitmap)格式。BMP文件默認的文件擴展名是.BMP或.bmp。
4.2 GIF文件格式
- GIF文件格式是CompuServe公司在1987年開發的圖像文件格式,任何商業目的使用均須由CompuServe公司授權。
- GIF文件主要是為數據流設計一種傳輸格式,不作為文件的存儲格式,它具有順序的結構形式。GIF文件主要由5部分組成:
- 文件標志塊: 標識"GIF"和版本號;
- 邏輯屏幕描述塊: 定義圖像顯示區域的參數,包含背景顏色信息、顯示區域大小、縱橫尺寸、顏色深淺以及是否存在全局彩色表;
- 全局彩色表: 其大小由圖像使用的顏色決定;
- 圖像數據塊: 包含圖像的描述塊,局部彩色表,壓縮圖像數據,圖像控制塊,無格式文本擴展塊,注釋擴展塊,應用程序擴展塊,此部分可以缺省;
- 尾塊: 為三維16進制數,表示數據流以及結束,此部分可以缺省。