第10天
本節學習了FCN圖像語義分割。全卷積網絡是用于圖像語義分割的一種框架。FCN是首個端到端(end to end)進行像素級(pixel level)預測的全卷積網絡。FCN有兩大明顯的優點:一是可以接受任意大小的輸入圖像,無需要求所有的訓練圖像和測試圖像具有固定的尺寸。二是更加高效,避免了由于使用像素塊而帶來的重復存儲和計算卷積的問題。
1.圖像語義分割是圖像處理和機器視覺技術中關于圖像理解的重要一環,AI領域中一個重要分支,常被應用于人臉識別、物體檢測、醫學影像、衛星圖像分析、自動駕駛感知等領域。語義分割的目的是對圖像中每個像素點進行分類。與普通的分類任務只輸出某個類別不同,語義分割任務輸出與輸入大小相同的圖像,輸出圖像的每個像素對應了輸入圖像每個像素的類別。語義在圖像領域指的是圖像的內容,對圖片意思的理解。
2.FCN主要用于圖像分割領域,是一種端到端的分割方法,是深度學習應用在圖像語義分割的開山之作。通過進行像素級的預測直接得出與原圖大小相等的label map。因FCN丟棄全連接層替換為全卷積層,網絡所有層均為卷積層,故稱為全卷積網絡。有三種技術:卷積化,上采樣,跳躍結構
3.網絡特點
3.1不含全連接層(fc)的全卷積(fully conv)網絡,可適應任意尺寸輸入。
3.2增大數據尺寸的反卷積(deconv)層,能夠輸出精細的結果。
3.3.結合不同深度層結果的跳級(skip)結構,同時確保魯棒性和精確性。
4.通過數據處理,數據預處理,數據加載,訓練集可視化,網絡構建,訓練準備,模型訓練,模型評估,模型推理學習了全卷積網絡的工作模式。