系統概述如下:
(a) 一個基于卷積神經網絡(ConvNet)的識別模型,該模型包含特征提取器和分類器;
(b) 一個少樣本分類權重生成器。這兩個組件都是在一組基礎類別上訓練的,我們為這些類別準備了大量訓練數據。在測試階段,權重生成器會接收少量新類別的訓練數據以及基礎類別的分類權重向量(分類器框內的綠色矩形),并為新類別生成相應的分類權重向量(分類器框內的藍色矩形)。這樣,卷積神經網絡就能同時識別基礎類別和新類別。
這篇文章的核心內容是關于一種新型的動態少樣本視覺學習系統,該系統能夠在測試時快速學習新類別,同時不會忘記其訓練時學到的初始類別(稱為基礎類別)。文章提出了兩個主要的技術創新:基于注意力的少樣本分類權重生成器和基于余弦相似性的卷積神經網絡(ConvNet)分類器。這些創新使得系統能夠在不犧牲基礎類別準確性的情況下,顯著提高少樣本識別的性能。
背景知識
文章首先指出,盡管深度卷積神經網絡(ConvNets)在圖像分類任務中取得了顯著成果,但它們需要大量的訓練樣本和計算資源。相比之下,人類視覺系統能夠僅通過少數幾個樣本快速學習新概念,這種能力啟發了機器學習中的少樣本學習研究領域。
研究方法
文章提出了一個少樣本視覺學習系統,目標是在測試時能夠高效地從少量訓練數據中學習新類別,同時不遺忘初始訓練的基礎類別。為此,作者提出了兩個技術上的創新: