目錄
一、小物體檢測
1、降采樣率減小 +空洞卷積
2、anchor設計
1)統計方法
2)anchor邊框聚類
3、多尺度訓練(multi scale training——MST)
4、 特征融合
一、小物體檢測
????????在分類任務中,一般物體的大小都差不多,這也使得單純的分類任務不需要考慮物體的大小等因素,但是在目標檢測中,因為在同一個圖像中,可能會出現多個目標,有的目標像素占比大,有的目標像素占比小,比如遠處的人高度只有30個像素,近處的人卻有幾百個像素,這導致在深度學習的前向傳播過程中,由于下降樣的因素,會導致小目標在降采樣的過程中直接丟失。
??????? 一般解決的方法有以下幾種:降采樣率減小、anchor設計、多尺寸訓練、特征融合、尺度歸一化(SNIP)
1、降采樣率減小 +空洞卷積
?????? 將采樣率下降的話就可以使得更小的物體能夠保留下來,而不至于在下采樣后一個像素點都不保留,但是減小下采樣率會導致模型的感受野減小,這樣對于模型是不利的,因此為了平衡二者之間的關系,一般我們可以使用空洞卷積來維持感受野的大小。
2、anchor設計
1)統計方法
????????設計多組anchor,然后將每一組anchor和真實框進行對比,以IOU和正樣本數作為指標。取一組性能指標指示最好的anchor作為訓練的anchor。
????????同一類物體雖然在單一尺寸上有很大的區別,但是在寬高比例上可能差別不大。
2)anchor邊框聚類
????????利用k-means等聚類算法對訓練集的真實框的長寬進行聚類,得到k個中心,將這些中心的值作為anchor生成的比例。具體可以參考yolov3模型。
3、多尺度訓練(multi scale training——MST)
??????? 訓練的時候將圖像縮放成指定的尺度,然后進行訓練。為了實現多尺度,先設置多組不同的尺度,然后每次迭代訓練的時候都是先隨機選取一個尺度,然后將輸入圖像縮放到這個尺度后再進行訓練,雖然在同一次的迭代時,尺度是一樣的,但是不同的迭代會有不一樣的尺度,這樣得到的模型就會有較高的魯棒性。
??????? 測試的時候則將圖像放大4倍或者其他倍數后,再進行檢測,這樣有利于小物體的檢測。
4、 特征融合
??????? 一個圖像在深度學習模型前向傳播的過程中,圖像會逐漸減小,導致圖像的細節丟失,語義信息增加。即淺層的圖像細節多,深層的圖像語義信息多,因此可以將深層的上采樣回來和淺層的進行融合。常見的有FPN、DetNet、彩虹融合、dssd等等
?5、
?