深度學習數據擴張_適用于少量數據的深度學習結構

作者:Gorkem Polat

編譯:ronghuaiyang

導讀

一些最常用的few shot learning的方案介紹及對比。

295029e70c238c31572779c7959ad5fd.png

傳統的CNNs (AlexNet, VGG, GoogLeNet, ResNet, DenseNet…)在數據集中每個類樣本數量較多的情況下表現良好。不幸的是,當你擁有一個小數據集時,它們通常不能很好地工作。但是,在許多真實的場景中,收集數據是很有挑戰性的。例如,在人臉識別系統中,通常每個人的圖像都很少,或者在醫學領域中,一些罕見疾病的病例也很有限。

那么,當你的類別中只有5個樣本,甚至每個類別只有一個樣本時,深度學習能提供什么呢?這個問題被稱為few-shot learning。這是一個活躍的研究領域,有許多成功的方法可以采用。在本文中,我將只提到一些最有前途的體系結構。

這篇文章不會深入地解釋架構,因為這會使文章變得很長。相反,我將只介紹架構的主要思想,以便任何希望處理小數據集的人都可以對模型有一個大致的了解。

Siamese Neural Networks

2fc0e20253112f055d53c5a2d7477bf8.png

Siamese Neural Networks的結構

Siamese神經網絡以兩個樣本作為輸入,輸出給定輸入是否屬于同一類的概率(或損失)。輸入樣本通過相同的網絡(共享權值),它們的嵌入在損失函數中進行比較(通常使用基于嵌入的差異的度量)。在訓練過程中,“網絡”學會以更穩健的方式對輸入進行編碼。首先,在支持集(驗證步驟)上對模型進行訓練,以學習相同/不同的配對。然后,將測試樣本與訓練集中的每個樣本進行比較,得到基于學習的編碼后的測試樣本與每個類(one-shot task)的相似度。它是在few-shot學習領域中第一個成功的模型之一,并成為其他模型的基礎。

ed7f76c1a708cc28da571e3ccefdd2c0.png

Siamese Neural Networks的步驟

Triplet Network and Triplet Loss

78279c547cdfa66f808b2e9dcae9586c.png

Triplet Networks

Triplet Network是對Siamese 網絡的擴展。Triplet網絡不使用兩個樣本,而是使用三個樣本作為輸入:positiveanchornegative樣本。Positive樣本和anchor樣本來自同一類,negative樣本來自不同類。Triplet損失的安排使得anchor的嵌入靠近positive而遠離negative。通過這種方式,網絡在提取嵌入信息時變得更加健壯。Triplet Networks已應用于人臉識別數據集,顯示出非常好的性能。

db0a59d62156a11d9b5dc9620eea5df8.png
92c953801d462378a53bc0fc9e0dd623.png

Triplet Loss

Matching Networks

790e2821b546595a8ae405a344d1aee4.png

Matching Networks

匹配網絡將嵌入和分類相結合,形成端到端可微的最近鄰分類器。對于模型的預測,y?是標簽的加權和,y?是訓練集。權重是成對相似性函數a(?, x?),查詢(測試)樣本和支持(訓練)樣本之間的相似性。匹配網絡的關鍵是相似函數的可微性。

b5a103ac0ce97b084e20f9416f10d87f.png
195fb49619bd7d87112dade23e78930a.png

其中C代表了余弦相似度函數,k是在訓練集中的樣本總數,函數f* 和g是嵌入函數。總體而言,在測試樣本?的嵌入和訓練集樣本x?的嵌入之間計算相似性。這個工作的主要創新點就是對嵌入函數優化得到最大的分類精度。

Prototypical Networks

aa9df62731e8270fa5e8e1056e9ee879.png

Prototypical Networks

原型網絡不將測試樣本與所有訓練樣本進行比較,而是將測試樣本與類原型(或平均類嵌入)進行比較。其關鍵假設是對于每個類別,存在一個嵌入,簇樣本的表示是分布在這個原型的嵌入c?的周圍的。在他們的論文中,證明了它的性能優于匹配網絡。

Meta-Learning

05060cbabb62c1c716a35c0f658ecf76.png

模型不可知Meta-Learning

元學習意味著學會學習。元學習試圖訓練模型的參數,使其通過一個或多個梯度步驟(像人類一樣)在新任務中表現最佳。模型的參數根據更新后的特定于任務的參數進行更新,使得任何任務在完成單一步驟后,其性能都是最高的。

與模型無關的元學習(MAML)的目的是學習一個通用的模型,這個模型可以很容易地對許多任務進行微調,只需要幾個迭代步驟。對于元批處理中的每個任務,使用基模型的權重初始化一個模型。采用隨機梯度下降(SGD)算法更新特定任務的權值。然后,使用更新后權重的損失總和來更新元學習者的權重。這里的目標是,對于幾個不同的任務,這些參數的損失將會很小。

15d4de65e9a762b09c7a6ea920e34b1b.png

模型不可知Meta-Learning算法

Bonus: MetaFGNet

12fc129567421af52a5f4b72d18b9820.png

MetaFGNet

除了目標任務網絡外,MetaFGNet還使用輔助數據訓練網絡。這兩個網絡共享初始層(基礎網絡)以學習一般信息。這種方法也被稱為多任務學習。將輔助數據(S)與目標數據(T)進行訓練,對目標訓練產生正則化效果。MetaFGNet還使用了一個名為sample selection的過程。輔助數據中的樣本通過網絡,對目標分類器的相似度打分,同時也計算源分類器。如果相似性高,得分也會高。只選擇得分閾值以上的樣本進行訓練。這里主要假設輔助數據S應該具有與目標集T類似的分布。結果表明,該過程提高了整體性能。使用元學習方法進行訓練效果有提升。

英文原文:https://medium.com/swlh/deep-learning-architectures-that-you-can-use-with-a-very-few-data-8e5b4fa1d5da

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/389032.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/389032.shtml
英文地址,請注明出處:http://en.pswp.cn/news/389032.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

時間管理

時間管理 時間管理是運用策略和技術,幫助你盡可能有效地利用你的時間。 不僅僅是要將時間用在正確的地方, 而且還要將盡可能有效地加以利用。 目前是如何利用時間的: 意識是時間管理的先決條件。目標提供路線圖。選擇是難點。 意識 第一條…

基于邊緣計算的實時績效_基于績效的營銷中的三大錯誤

基于邊緣計算的實時績效We’ve gone through 20% of the 21st century. It’s safe to say digitalization isn’t a new concept anymore. Things are fully or at least mostly online, and they tend to escalate in the digital direction. That’s why it’s important to…

本線程鉤子

鉤子其實就是調用一下API而已: 1、安裝鉤子:   SetWindowsHookEx 函數原形:HHOOK SetWindowsHookEx( int idHook, // 鉤子類型, HOOKPROC lpfn, // 鉤子函數地址…

Maven Web項目解決跨域問題

跨域問題目前筆者所用到的方案大致有三種:jsonp,SpringMVC 4以上注解方式和cros三方過濾器。 Jsonp JSONP(JSON with Padding)是一個非官方的協議,它允許在服務器端集成Script tags返回至客戶端,通過javascript callback的形式實現跨域訪問(這…

為什么Facebook的API以一個循環作為開頭?

作者 | Antony Garand譯者 | 無明如果你有在瀏覽器中查看過發給大公司 API 的請求,你可能會注意到,JSON 前面會有一些奇怪的 JavaScript:為什么他們會用這幾個字節來讓 JSON 失效?為了保護你的數據 如果沒有這些字節,那…

城市軌道交通運營票務管理論文_城市軌道交通運營管理專業就業前景怎么樣?中職優選告訴你...

??城市軌道交通運營管理專業,專業就業前景怎么樣?就業方向有哪些?有很多同學都感覺很迷忙,為了讓更多的同學們了解城市軌道交通運營管理專業的就業前景與就業方向,整理出以下內容希望可以幫助同學們。城市軌道交通運…

計算機視覺對掃描文件分類 OCR

通過計算機視覺對掃描文件分類 一種解決掃描文檔分類問題的深度學習方法 在數字經濟時代, 銀行、保險、治理、醫療、法律等部門仍在處理各種手寫票據和掃描文件。在業務生命周期的后期, 手動維護和分類這些文檔變得非常繁瑣。 對這些非機密文檔進行簡…

從錢龍數據中讀取股票權息信息導入到數據庫

從錢龍數據中讀取股票權息信息導入到數據庫 前面寫了如果讀股票代碼和日線數據,下面是如何讀股票的權息信息。 錢龍中權息數據存儲在QLDATA/history/shase/weight和QLDATA/history/sznse/weight目錄下,每個文件對應一只股票。 與前文一樣,只貼…

笑話生成器_爸爸笑話發生器

笑話生成器(If you’re just here for the generated jokes, scroll down to the bottom!)(如果您只是在這里生成笑話,請向下滾動到底部!) I thought: what is super easy to build, yet would still get an approving chuckle if someone found it on …

AWS Amplify Console:賦予應用程序快速部署的能力

AWS re:Invent 2018大會發布了很多新功能和服務,包括新的AWS Amplify Console,一種針對移動Web應用程序的持續部署服務。 AWS Amplify Console承諾可以支持快速發布新功能,避免在部署應用程序時停機,并降低同時更新應用程序客戶端…

機器學習實踐二 -多分類和神經網絡

本次練習的任務是使用邏輯歸回和神經網絡進行識別手寫數字(form 0 to 9, 自動手寫數字問題已經應用非常廣泛,比如郵編識別。 使用邏輯回歸進行多分類分類 練習2 中的logistic 回歸實現了二分類分類問題,現在將進行多分類,one vs…

Hadoop 倒排索引

倒排索引是文檔檢索系統中最常用的數據結構,被廣泛地應用于全文搜索引擎。它主要是用來存儲某個單詞(或詞組)在一個文檔或一組文檔中存儲位置的映射,即提供了一種根據內容來查找文檔的方式。由于不是根據文檔來確定文檔所包含的內…

koa2異常處理_讀 koa2 源碼后的一些思考與實踐

koa2的特點優勢什么是 koa2Nodejs官方api支持的都是callback形式的異步編程模型。問題:callback嵌套問題koa2 是由 Express原班人馬打造的,是現在比較流行的基于Node.js平臺的web開發框架,Koa 把 Express 中內置的 router、view 等功能都移除…

Bind9的dns解析服務

前言隨著原中國電信集團按南北地域分家,新的中國電信和網通集團隨即成立,互聯網的骨干網也被一分為二了,北有網通、南有電信。從此,細心的網民可以發現,有些經常訪問的網站速度一下子慢了下來,有時候還有訪…

上凸包和下凸包_使用凸包聚類

上凸包和下凸包I recently came across the article titled High-dimensional data clustering by using local affine/convex hulls by HakanCevikalp in Pattern Recognition Letters. It proposes a novel algorithm to cluster high-dimensional data using local affine/c…

sqlmap手冊

sqlmap用戶手冊 | by WooYun知識庫 sqlmap用戶手冊 當給sqlmap這么一個url (http://192.168.136.131/sqlmap/mysql/get_int.php?id1) 的時候,它會: 1、判斷可注入的參數 2、判斷可以用那種SQL注入技術來注入 3、識別出哪種數據庫 4、根據用戶選擇&…

幸運三角形 南陽acm491(dfs)

幸運三角形 時間限制:1000 ms | 內存限制:65535 KB 難度:3描述話說有這么一個圖形,只有兩種符號組成(‘’或者‘-’),圖形的最上層有n個符號,往下個數依次減一,形成倒置…

jsforim

var isMouseDownfalse;var isFirsttrue;var centerdivObj;var ndiv1;var ndiv2;var ndiv3;var kjX;var kjY; window.οnerrοrfunction(){ return true;}; var thurlhttp://qq.jutoo.net/;var wzId12345; function createDiv(){ var sWscreen.width; var sHscree…

決策樹有框架嗎_決策框架

決策樹有框架嗎In a previous post, I mentioned that thinking exhaustively is exhausting! Volatility and uncertainty are ever present and must be factored into our decision making — yet, we often don’t have the time or data to properly account for it.在上一…

湊個熱鬧-LayoutInflater相關分析

前言 最近給組內同學做了一次“動態換膚和換文案”的主題分享,其中的核心就是LayoutInflater類,所以把LayoutInflater源碼梳理了一遍。巧了,這周掘金新榜和部分公眾號都發布了LayoutInflater或者換膚主題之類的文章。那只好站在各位大佬的肩膀…