數據是泰迪杯主辦方提供的已經標記好的數據,4k畫質的圖片,總大小8個G
鏈接:https://pan.baidu.com/s/1fvmNHGrLvflEovjfCjDLOw?pwd=6666?
提取碼:6666?
蟲害包括:
八點灰燈蛾 | 褐飛虱屬 | 白背飛虱 | 二化螟 | 蟋蟀 | 黃足獵蝽 | 黃毒蛾 | 粘蟲 |
?
農田蟲害識別優秀作品?
https://www.tipdm.org/u/cms/www/202206/27143450a8sn.pdf?
解決方案
在上述背景研究、問題分析和相關研究的基礎之上,我們針對本次農作物害蟲識 別任務,采用基于兩階段的目標檢測算法 Casecade RCNN 和結合 Swin-Transformer 的 Mask RCNN 算法作為基本框架,進行模型融合,并使用離線數據增強和在線數據增強 組合,以及 SWA(隨機權重平均)進一步進行性能的提升。
針對 1.2 提出的四個問題,相應采用以下解決方案:
1) 目前主流的目標檢測算法都是基于兩階段的方法(Fast RCNN、Faster RCNN、Mask RCNN等)以及一階段的方法(YOLO系列、SSD等),相比 于對識別速度的要求,農作物害蟲檢測更偏向于算法識別精確度的要求,故 選用主流的兩階段目標檢測方法作為模型:Cascade Mask RCNN ,并使用目 前在目標檢測領域效果最好的 Swin-Transformer 模型作為我們的特征提取層。
2) 針對某些類別目標太小以及個別類別樣本數目,我們采用 copy and paste 方 法離線數據增強進行擴充數據集,并且采用隨機反轉、旋轉、高斯噪聲等在線數據增強進一步在訓練之前處理數據集。以及對訓練集和測試集數據使用 多尺度進行訓練和預測,增加對小目標的識別效果。
3) 為了能更好的提升模型的識別效果,進一步使用每個模型不同的 epoch 的權 值進行 SWA,并把使用兩個模型 SWA 后的網絡權重的預測結果進行 NMS, 獲取模型融合后的檢測結果。
對于目標檢測,基于深度學習的主流模型大致分為兩類:
(1)兩階段目標檢測算
法:Fast RCNN、Faster RCNN、Mask RCNN、Cascade Mask RCNN 等,這些方法首先
產生候選區域(region proposals),然后對候選區域進行分類;
(2)一階段檢測算法:
不需要 region proposals 階段,直接產生目標的類別概率和位置坐標值,如 Yolo 系列和
SSD。
優缺點分析
優點:
? 通過對農作物害蟲圖片的數據集處理和進行數據增強,能夠有效的應對長尾 效應和多尺度目標問題;
? 選擇 Resnet50 Cascade Mask RCNN 和 Swin-S Cascade Mask RCNN 作為主要模 型,更能貼合農作物害蟲識別的目標檢測任務;
? 采用 K-means 聚類完成錨框長寬比的確定,使用 Smooth L1 損失函數和 Soft NMS,更能符合害蟲識別的應用場景;
? 基于隨機權重平均和多模型融合的方法,讓網絡識別效果更好,緩解誤檢和 漏檢的可能性。
缺點:
? 由于采用 Swin-S Cascade Mask RCNN 和 Resnet50 Cascade Mask RCNN 兩個模 型進行訓練,以及采用訓練時和測試時的多尺度,導致模型的訓練和檢測, 需要耗費大量的顯存資源以及時間成本;
? 基于 copy and paste 的數據擴充方法,還是有一定程度存在與背景不符的可能 性,存在少數圖片的重疊情況,應該進一步考慮。
?