?? 我說的初始化,還不是算法的初始化工作,而是讀入圖像,響應鍵盤鼠標之類的工作。作者提供的代碼中的工作包含了從攝像頭讀取和從文件中讀取兩種輸入方案。這里介紹一下從文件輸入的辦法。因為OpenCV從視頻讀取圖像序列的辦法有很好的demo,我這里就不介紹攝像頭的辦法了。TLD下載后有一個文件夾是_input,里面存放著一組圖片組,圖片文件的名字為00001.png、00002.png....。我讀取圖片組的關鍵代碼如下,這段代碼具有普遍意義,可以移植到以后想讀入圖片組的任意程序中:
- stringstream?fileNameStream;??
- string?sourceImageFileName;??
- for(int?nFrame=0;?nFrame<NUM;?nFrame++)??
- {??
- ????nFrame++;??
- ????fileNameStream?<<?"_input\\"?<<?setw(5)?<<?setfill('0')?<<?nFrameNum?<<?".png";??
- ????sourceImageFileName?=?fileNameStream.str();??
- ????fileNameStream.clear();??
- ????fileNameStream.str("");??
- ??
- ????//?讀取圖像??
- ????g_src?=?imread(sourceImageFileName);??
- }??
????? 這就實現了圖片的讀入工作,再參考camshiftdemo的辦法實現了鼠標和鍵盤的響應。鼠標的響應就是得到目標區域的范圍,用鼠標選中boundingbox。文件讀進來了,目標區域boundingbox也得到了,接下來就是需要對算法進行研究了。
???? 先介紹幾個我研究過的心得,bbox文件夾下面的代碼主要都是對boundingbox的處理。tld文件夾下面的存放的是主干的算法,從run_TLD入手,感覺就是對起始幀進行初始化工作,然后逐幀讀入圖片序列,進行算法處理。還是先分析初始化工作,作者的tldInitSource函數實現的就是基本的初始化,給一些變量賦值,開辟矩陣大小,這個沒什么好講的。tldInitFirstFrame文件完成的工作就是選中boundingbox,這個功能我已經通過鼠標的響應得到了boundingbox,也可以略過不細分析。重點的初始化工作是在tldInit里實現的,這個函數也是我接下來研究的重點,本人Matlab較差,真希望有高人指點啊,一起研究啊