活動地址:https://xihe.mindspore.cn/events/mindspore-training-camp
簽名:Sam9029
這一章節 出現了一個 深度學習 中經常出現的概念
- 全卷積網絡(Fully Convolutional Networks) :
官話:FCN 主要用于圖像分割領域,是一種端到端的分割方法,是深度學習應用在圖像語義分割的開山之作。通過進行像素級的預測直接得出與原圖大小相等的 label map。因 FCN 丟棄全連接層替換為全卷積層,網絡所有層均為卷積層,故稱為全卷積網絡
自己理解一下:
全卷積網絡(FCN)就像是一個超級放大鏡,它能夠放大圖像中的每一點細節,并且告訴計算機每個像素點是什么。
想象一下,你手中拿著一張城市的照片,你想知道照片中的每個地方分別是什么,比如哪里是建筑物,哪里是道路,哪里是樹木。
全卷積網絡就能做到這一點。
全卷積網絡(FCN)簡介
FCN是一種用于圖像語義分割的深度學習框架,由UC Berkeley的Jonathan Long等人在2015年提出。它是首個能夠進行端到端像素級預測的全卷積網絡。
FCN的關鍵技術
1.卷積化:FCN使用VGG-16作為backbone,將全連接層轉換為卷積層,使網絡能夠輸出與輸入圖片大小相同的heatmap。
2.上采樣:為了從較小的特征圖中恢復到原圖大小,FCN采用上采樣技術。這通常涉及到雙線性插值,并在網絡中通過反向傳播學習非線性上采樣。
3.跳躍結構(Skip Layer):FCN通過跳躍結構結合深層的全局信息和淺層的局部信息,以提高分割的精確度。例如,FCN-8s通過將底層的預測與pool3層的預測相加,來獲取更多的局部細節。
FCN的網絡特點
適應性:不含全連接層,可以接受任意尺寸的輸入。
精細度:通過反卷積層增大數據尺寸,輸出更精細的結果。
擼棒性與精確性:結合不同深度層的結果,確保了分割結果的擼棒性和精確性。
雖然這一節技術的內容實在是太難了,入門的門檻太高了,但是我對圖像語義分割和FCN全卷積網絡有了更深入的理解,我相信隨著技術的不斷進步,這些技術將在圖像處理領域發揮更大的作用。同時,我也期待自己能夠在實踐中不斷探索和應用這些技術,以解決更多實際問題。