SAConv可切換空洞卷積
帶來的改進機制時可切換的空洞卷積
是一種創新型卷積網絡
專門為增強物體檢測和分割任務,中特征提取去設計
SAC核心時相同的輸入兒子應用到不同空洞率去進行卷積,設計特別開關函數融合這些不同卷積的成果
該方法可讓網絡更靈活的適應不同尺寸的特征
更準確的識別分割圖像物體
現代檢測器,廣泛使用兩次觀察思考機制
引入概念,遞歸特金字塔和可切換的空洞卷積
遞歸特征金字塔,自底向上的基礎層和上層網絡間額外加了反饋鏈接
而可切換的空洞卷積通過不同的空洞率對特征機械能卷積,使用函數進行二者的結果合并
兩種方法叫做DetectoRS ,顯著提升性能,
1、可切換空洞卷卷積SAC,
不同空洞率的應用,SAC核心思想對相同的輸入特征應用不同的空洞率計算,去應對不同尺度的特征
2、開關函數
使用開關函數去組合不同空洞率,
意味著不同位置對應的不同開關來控制SAC輸出
3、轉換機制,
SAC將傳統的卷積層換成SAC層,通過不同的空洞率去使用權重實現,
轉換機制時用平均池化層+1*1的卷積層實現開關功能
結構設計
SAC 包含三部分,兩個全部上下模塊+SAC組件
總結: SAC通過這些創新的設計和機制,提高了網絡在處理不同尺度和復雜度的特征時的適應性和準確性,從而在物體檢測和分割領域顯示出顯著的性能提升。
關鍵點
1、具有雙重觀察機制,對輸入特征進行兩次觀察,每次使用不同的空洞率,去捕獲不同尺度的特征信息,更深入的分析數據
2、開關卷積函數,不同空洞率得到的輸出結果和開關函數結合在一起,這些開關決定了兩次空洞卷積的信息,使用那些信息,最終的最終輸出特征,
總結,SAC通過雙重觀察并結合策略,能夠有效的處理復雜的特征模式,尤其時在尺度變化比較大的情況,提高了特征提取靈活性和適應性沒
1、轉換傳統層為SAC
展示了空洞卷積,傳統卷積SAC層,骨干網絡,每個3*3卷積轉化為SAC,轉換可以在卷積計算中不同的空洞率切換,
2、權重共享與訓練差異
在SAC不同空洞率進行切換,這些操作可以共享相同的權重,只有訓練差異,減少模型復雜性,
3、全局上下文模塊
SAC結構還包含另外兩個全局上下文模塊,這些哦為特征添加了圖像級別的信息,更好的去提取質量和準確性
總結:
SAC通過這額機制,允許網絡在不同的空洞率見轉換,,實現共享權重策略,提升特征提取額能力,在SAC檢測物體分割也優秀表現
YOLO 參數詳解
1
2
3
YOLOv8訓練參數詳解(全面詳細、重點突出、大白話闡述小白也 …
https://blog.csdn.net/qq_37553692/article/details/130898732
Yolov5參數解析_yolov5參數詳解-CSDN博客
https://blog.csdn.net/qq_56591814/article/details/127172215
Yolov8模型調參大全:超詳細解讀每一個參數_yolov8訓練參數-CS…
https://blog.csdn.net/weixin_45303602/article/details/140174159
YOLO(You Only Look Once)是一種實時目標檢測算法,廣泛應用于計算機視覺領域。YOLOv8是YOLO系列的最新版本,提供了許多可調參數來優化模型性能。以下是一些關鍵參數及其解釋:模型參數model: 模型文件的路徑,可以是預訓練模型(如yolov8n.pt)或模型配置文件(如yolov8n.yaml)。預訓練模型包含了模型的結構和訓練好的參數,適合直接使用。data: 數據集配置文件的路徑,例如coco128.yaml。該文件包含了訓練和驗證所需的圖像和標簽信息。epochs: 訓練的輪數,決定了模型將遍歷整個訓練數據集的次數。輪數越多,模型學習越充分,但訓練時間也會增加。訓練參數batch: 每個批次中的圖像數量。批次大小越大,模型學習效果越好,但需要更多的顯存。imgsz: 輸入圖像的尺寸,可以指定一個整數表示圖像的邊長,或指定寬度和高度的組合。save: 是否保存訓練的檢查點和預測結果。設置為True時,訓練過程中會保存模型的權重和訓練狀態。device: 訓練運行的設備,例如cuda:0表示使用第一個GPU,cpu表示使用CPU。優化參數optimizer: 選擇要使用的優化器,如SGD、Adam、AdamW等。不同的優化器適用于不同的任務。lr0: 初始學習率,控制模型參數更新的步幅。momentum: 動量,用于加速梯度下降過程,增加參數更新的穩定性。weight_decay: 權重衰減,防止過擬合。數據增強和正則化mosaic: 是否使用馬賽克數據增強,增加模型對圖像局部特征的學習能力。label_smoothing: 標簽平滑,減少模型對訓練數據的過擬合。dropout: 丟棄正則化,減少模型的過擬合風險。其他參數patience: 早停的等待輪數,如果在一定輪數內沒有性能提升,則停止訓練。workers: 數據加載時的工作線程數,增加數據讀取速度。resume: 是否從最后一個檢查點恢復訓練。