參考:四、全卷積網絡FCN詳細講解(超級詳細哦)
這篇文章已經寫的很好了,這里說兩個我考慮的點。
第一個就是:FCN在縮小成heat map,為什么要通過上采樣還原回原圖大小?
我覺得這個的原因是因為,FCN需要找到原圖目標的一個范圍,通過放大去找到。比如說,輸入是64×64的圖像,在縮小到4×4之后,發現最大score在左上角,那么在通過采樣后還原的圖像,也可以尋找最大值來找到目標區域。
第二個就是:FCN和CNN的主要區別方面
我覺得主要區別不僅僅在于FCN在中間層不需要明確輸出的size,重要的是輸出方面,CNN要輸出一個向量,代表每一類的幾率,而FCN輸出是一個map或多個map,然后每個map代表一類在map中的幾率。而且FCN的輸入可以任意大小,而CNN是指定的。