在最新版的2.4.2中,文檔的更新也是一大亮點,refrence manual擴充了200多頁的內容,添加了contrib部分的文檔。contrib就是指OpenCV中新添加的模塊,但又不是很穩定,可以認為是一個雛形的部分。這次結合refman的閱讀,介紹一下FaceRecognizer這個人臉識別類,這個類也是2.4.2更新日志里著重強調過的更新,配套的文檔也是相當充實。這個類的基類也是Algorithm類,對于Algorithm類的簡單介紹,請參看我之前的blogOpenCV學習筆記(五十)——Algorithm類介紹(core),這個類內的接口函數也是異常簡單,人臉識別的任務也就是兩大部分,訓練和預測,分別對應著train函數和predict函數,還有對應的數據加載保存函數save和load。不過它當然還可以調用其基類Algorithm的函數。特別說明的是,人臉識別中預測的參數也是可以調節的,但這里只給出了train和predict函數,為啥沒有setparameter的函數呢,那是因為各中人臉識別方法的參數并不相同,要通過Algorithm的get和set函數實時的調整~~v5啊!
先來說說訓練的過程,train函數的兩個參數也很簡單,訓練的圖像組vector<Mat>和對應的標簽組vector<int>,這個label標簽只需保證同一個人的標簽相同即可,不需要保證圖像的按標簽順序輸入,方便極了。對于預測,有兩種調用,其中的參數有測試圖像、返回的標簽值和測試樣本和標簽樣本的相似性。返回的標簽值為-1,說明測試樣本在訓練集中無對應或距離較遠。這里用個FisherFace作為示例說明一下如何訓練和預測:
- vector<Mat>?images;??
- vector<int>?labels;??
- //?images?for?first?person??
- images.push_back(imread("person0/0.jpg",?CV_LOAD_IMAGE_GRAYSCALE));??
- labels.push_back(0);??
- images.push_back(imread("person0/1.jpg",?CV_LOAD_IMAGE_GRAYSCALE));??
- labels.push_back(0);??
- //?images?for?second?person??
- images.push_back(imread("person1/0.jpg",?CV_LOAD_IMAGE_GRAYSCALE));??
- labels.push_back(1);??
- images.push_back(imread("person1/1.jpg",?CV_LOAD_IMAGE_GRAYSCALE));??
- labels.push_back(1);??
- ??
- Ptr<FaceRecognizer>?model?=?createFisherFaceRecognizer();??
- model->train(images,?labels);??
- ??
- Mat?img?=?imread("person1/2.jpg",?CV_LOAD_IMAGE_GRAYSCALE);??
- int?predicted?=?model->predict(img);??
當然我們也不需要每次使用都進行一次訓練,可以把訓練好的模型通過save函數保存成一個文件,下次使用的時候只需load即可。
目前支持的3種人臉識別的方案:特征臉EigenFace、Fisher臉FisherFace、LBP直方圖LBPHFace。分別調用函數createEigenFaceRecognizer、createFisherFaceRecognizer、createLBPHFaceRecognizer建立模型。
對于EigenFace兩個輸入參數,分別為PCA主成分的維數num_components和預測時的閾值threshold,主成分這里沒有一個選取的準則,要根據輸入數據的大小而決定,通常認為80維主成分是足夠的。除了這兩個輸入參數外,還有eigenvalues和eigenvectors分別代表特征值和特征向量,mean參數為訓練樣本的平均值,projections為訓練數據的預測值,labels為預測時的閾值。
對于FisherFace,和EigenFace非常相似,也有num_components和threshold兩個參數和其他5個參數,FisherFace的降維是LDA得到的。默認值為c-1,如果設置的初始值不在(0,c-1]的范圍內,會自動設定為c-1。
特別需要強調的是,EigenFace和FisherFace的訓練圖像和測試圖像都必須是灰度圖,而且是經過歸一化裁剪過的。
對于LBPHFace,我想不用過多介紹,LBP簡單和效果是大家都很喜歡的,參數包括半徑radius,鄰域大小即采樣點個數neighbors,x和y方向的單元格數目grid_x,grid_y,還有兩個參數histograms為訓練數據得到的直方圖,labels為直方圖對應的標簽。這個方法也要求訓練和測試的圖像是灰度圖
接下來應該結合文檔進一步研究一下這個人臉識別類。我之前大量的人臉實驗都是在matlab下進行的,有了這個利器,我感覺會有越來越多的學生做老師和老板布置的project會選擇用OpenCV,而不是Matlab。希望我們都愛的OpenCV越來越好,越來越強大。歡迎交流