膠囊網絡是 vector in vector out的結構,最后對每個不同的類別,輸出不一個向量,向量的模長表示屬于該類別的概率。
例如,在數字識別中,兩個數字雖然重疊在一起,Capsule中的兩個向量能完整表達兩個數字的特征,雖然有些特征重疊在一起導致難以分辨。
因為膠囊網絡中:用向量模的大小衡量某個實體出現的概率,模值越大,概率越大。
更加形象的解釋:https://blog.csdn.net/godwriter/article/details/79216404
MNIST數據集中,膠囊網絡(CapsGNN)輸出性能遠超CNN,膠囊網絡的其他應用:
1、通過膠囊網絡抵御對抗性攻擊
2、膠囊網絡+圖卷積GCN的圖分類能力
3、膠囊網絡+注意力機制=零樣本意圖識別
關于膠囊網絡的相關學術論文還有不少,比如基于膠囊網絡的手勢識別,正確率達到94.2%,能夠幫助聽障人群進行更有效地溝通;以及在ICLR 2019上發表的圖片分類新框架膠囊圖神經網絡(CapsGNN),也是將膠囊網絡與圖神經網絡(GNN)結合的新模型。
https://zhuanlan.zhihu.com/p/66923740
蘇劍林博客: