#Superpixel-based Graph Convolutional Network for Semantic Segmentation
github鏈接
引言
GNN模型根據節點特征周圍的邊來訓練節點特征,并獲得最終的節點嵌入。通過利用具有不同濾波核的二維卷積對來自附近節點的信息進行整合,給定超像素方法生成的特征信息。本文是基于圖卷積神經網絡,利用超像素圖斑對象構建圖結構數據,通過對節點實現語義分類,實現超像素分割。
- 圖學習框架:
* 轉導學習的訓練和預測階段,邊緣和節點保持不變。因此,它不允許泛化到不可見的節點和邊。
* 歸納學習始于在具有某些圖屬性的訓練網絡中學習模型。經過訓練的模型可以近似訓練圖中可能鏈接的未知特征。 - 圖卷積與CNN具有相同的屬性:
通過普卷積與空間卷積進行分類
* 譜圖卷積使用基于圖信號傅里葉變換的譜濾波器,即圖拉普拉斯矩陣的特征分解。但是,它需要一個完整且固定的圖,因為圖拉普拉斯依賴于整體圖結構
* Spatai卷積網絡學習節點嵌入函數,僅反映節點的局部鄰域,而不是引用整個圖,該模型成功地處理了看不見的圖或圖中的連續變化
實驗結果:
這是一篇2019-2020年的文章,文章的算法精度不是很高,實驗數據是無人機數據,相較于經典的CNN與transformer深度學習算法的精度是稍差一些,但對于一些樣本數據較少的可能提供一些解決思路,單張輸入影像可以達到3000*3000左右,這里利用超像素在一定程度上實現了數據降維的作用。
看過文章提供的代碼后發現,文章在構建圖結構信息的時候,僅使用了超像素圖斑的像素平均值作為特征。有關圖卷積神經網絡比較新的文章采用的策略是先通過卷積神經網絡進行特征提取,然后采用圖結構作為解碼端去結合一些先驗信息實現分類或分割,后續會更新一篇相關文章作為參考。
文章提供的代碼基于dgl和pytorch實現,對顯存有一定要求。