元學習(meta-learning)的通俗解釋

目錄

1、什么是元學習

2、元學習還可以做什么

3、元學習是如何訓練的


1、什么是元學習

meta-learning 的一個很經典的英文解釋是 learn?to?learn,即學會學習。元學習是一個很寬泛的概念,可以有很多實現的方式,下面以目標檢測的例子來解釋其中的思想。

在傳統的目標檢測任務中,我們都會為給模型海量的打了標簽的數據集,本質是讓模型去學習樣本數據的數據分布,以期一個泛化的模型,使其可以在沒有見過的圖片中找到期望的目標。整個學習的過程就是相當于給模型很多某一類事物的照片,訓練模型讓他擁有分辨這些事物種類的能力,可以在一張沒有見過的照片中找到是否有目標事物。

對于人類而言,認識一個新的種類其實并不需要看很多相關的照片,甚至只要看一眼沒見過的事物就能達到在沒見過的照片中準確分辨是否含有該類事物的效果,這是由于人天生的具有分辨事物異同的能力,在看到新的事物之后就能馬上學習到他與已見過的事物的不同并在下次遇到時準確判斷其種類。也就是人類具有學會學習的能力。

因此,相比來說,meta-learning 的目標不是讓模型識別訓練集里的圖片并且泛化到測試集,而是讓機器自己學會學習。還以目標檢測為例,仍然拿一個很大的數據集來訓練模型,而 meta-learning 的目標不是讓模型在沒見過的圖片中學會分辨訓練集中提到過的類別,而是讓模型學會分辨事物的異同,學會分辨這兩者是相同的東西還是不同的東西,當模型學會分辨異同之后再在具體的分類任務中使用極少的數據集訓練很少的次數即可達到甚至超越傳統目標檢測訓練范式的效果(這種方式也稱為 Few-Shot?Learning,即小樣本學習)。

總的來說,當我們需要分辨的目標種類改變之后,傳統的目標檢測訓練范式需要從頭開始訓練,而 meta-learning 則因為擁有了學習的(分辨異同)能力從而很快就能適應新的種類從而大大節省了從新學習的時間。下圖就是對這種方法的闡述:元學習 A?通過訓練任務學習到了具有分類能力的預訓練網絡?F_{\omega } ?(F_{\omega }?是元學習的模型),使用新的類型來訓練?F_{\omega } , 讓他“學習”區分新的種類手機電腦得到模型??f_{\theta } ?,這個?f_{\theta } 就是可以適應新的任務的模型了。

元學習分類任務

(圖片來源:火爐課堂 | 元學習(meta-learning)到底是什么鬼?_嗶哩嗶哩_bilibili)

這種訓練方式的一種具體的實現就是孿生神經網絡(Siamese?Network),孿生神經網絡是無監督學習的一種,下面簡單介紹這種網絡的原理。

孿生神經網絡擁有兩個輸入,分別是同樣大小但不是同一種類別的圖片,輸出是兩張圖片的相似度。其結構如下圖

孿生神經網絡

具體地,先輸入含有種類1的圖片1,通過網絡得到一個映射的特征向量h1,然后輸入含有種類2的圖片2,通過同樣的網絡得到另外一個映射的特征向量h2,通過比較向量h1、h2(比如做差)的相似度即可確定兩者是否屬于同一個類別,訓練過程中只需要通過大量的不同類別的圖片訓練網絡的異同辨別能力。在具體的分類任務中,我們只需要將目標圖片與已有的已知種類的圖片通過預訓練好的神經網絡做對比,通過輸出即可判斷目標圖片是否屬于這個種類。

以上是元學習在目標檢測方面的一種應用,通過元學習訓練模型提取不同種類圖片的特征,然后在這個預訓練的模型的基礎上實現快速辨別新的圖片種類。“元”在中文中含有“根本、根源”的意思,在深度學習中可以理解為:知道了更深層次(更基礎)的知識后更有利于以后適應新事物的能力,這也對應了其英文解釋“learn?to?learn”的思想。

2、元學習還可以做什么

元學習是一個思想,有很廣泛的應用范圍。

元學習可以用來學算法。即傳統的深度學習都是手工設計好的模型(比如CNN、LSTM、DNN、具體多少層、每層的size以及激活函數都是確定好的)然后我們去學習模型的參數。而元學習可以更進一步,用來學習如何設計模型、如何挑選前述的網絡結構等。

另外元學習還可以學習算法的超參(比如學習率等)、模型初始化參數(直接給出一個比較好的初始化參數,然后微調,可以大大節省訓練時間)等。

3、元學習是如何訓練的

一般的深度學習是在數據(data)上做訓練,以使模型泛化到其他數據上也有很好的效果。而元學習是在任務(task)上做訓練,以使模型在沒見過的任務上也做得很好。

如下圖所示。首先元學習?F_{\omega }?在任務1(task1)中學習得到算法(可以是模型結構、超參、初始化參數等)f_{\theta }?,然后使用測試樣本訓練幾次(一般一兩次就可以了)F_{\omega } ?得到的模型?f_{\theta }?,在測試樣本中評估元學習給出的算法?f_{\theta }?好不好,進而評估元學習?F_{\omega }?好不好,因為好的算法在訓練有限次時就能達到較好的效果,這樣每組測試樣例就可以得到一個損失,若算法不好則對應得出的損失也不好,task2 也是同樣的流程。這樣將每個 task?的損失加起來求平均得到最終的損失。

元學習的訓練過程

(圖片來源:火爐課堂 | 元學習(meta-learning)到底是什么鬼?_嗶哩嗶哩_bilibili)

可以看出,相比一般的深度學習過程,大部分的元學習任務在訓練過程中需要計算二次導數,目前也有最新的研究表明將二次導通過一定的規則近似為一次導數更新模型不僅可以大大提升訓練效率,還跟原始的二次導訓練方式的性能不相上下,該部分目前僅僅了解了一下,先不做過多的學習。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/711093.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/711093.shtml
英文地址,請注明出處:http://en.pswp.cn/news/711093.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

阿里Replace Anything:一鍵替換萬物,讓圖像編輯更簡單

最近,阿里巴巴智能研究院在AIGC領域可謂動作頻頻,新品發布不斷,在之前的文章已經向大家介紹了關于Animate AnyOne, Outfit Anyone,AnyText, AnyDoor等相關技術,感興趣的小伙伴可以點擊下面鏈接閱讀~ AI一鍵…

Laravel - API 項目適用的圖片驗證碼

1. 安裝 gregwar/captcha 圖片驗證碼接口的流程是: 生成圖片驗證碼 生成隨機的 key,將驗證碼文本存入緩存。 返回隨機的 key,以及驗證碼圖片 # 不限于 laravel 普通 php 項目也可以使用額 $ composer require gregwar/captcha2. 開發接口 …

神經網絡算法詳解以及應用場景

神經網絡算法是一類基于神經網絡思想的機器學習算法。神經網絡是一種模擬人腦神經系統的計算模型,由大量的人工神經元組成,這些神經元通過可調的連接權值相互連接,形成復雜的網絡結構。神經網絡具有大規模并行處理、分布式信息存儲、良好的自…

小塔RFID技術幫您解決“倉儲管理危機”!

商品積壓對一個企業帶來的影響是久遠的,倉儲管理流轉失衡:庫存數據不準確、繁瑣人工管理費時費力、商品爆倉及庫存短缺等造成“倉儲管理危機”,讓企業自身陷入困境。 優化倉儲管理,小塔RFID倉儲管理方案輕松解決。利用RFID&#x…

java數據結構與算法刷題-----LeetCode538. 把二叉搜索樹轉換為累加樹

java數據結構與算法刷題目錄(劍指Offer、LeetCode、ACM)-----主目錄-----持續更新(進不去說明我沒寫完):https://blog.csdn.net/grd_java/article/details/123063846 文章目錄 解題思路 BST二叉搜索樹,中序遍歷結果為一個升序序列…

【C語言】三子棋

前言: 三子棋是一種民間傳統游戲,又叫九宮棋、圈圈叉叉棋、一條龍、井字棋等。游戲規則是雙方對戰,雙方依次在9宮格棋盤上擺放棋子,率先將自己的三個棋子走成一條線就視為勝利。但因棋盤太小,三子棋在很多時候會出現和…

心得 醒悟

學習是一個學習,遺忘,回憶。。。的一個不間斷個過程,學習python很心急,沒有怎么實操,開著2倍速看視頻,導致看過后很多對列表,字典的命令等等就忘記了,沒有真的學會,導致現…

Unity(第十四部)光照

原始的有默認燈光、除了默認的你還可以創建 1、定向光源(類似太陽、從無限遠的地方射向地面的光,光源位置并不影響照射角度等,不同方向的旋轉影響角度和明亮) 1. 顏色:調整光的顏色2. 模式:混合是實時加烘…

FCU2601嵌入式控制單元獲得開普「電磁兼容檢驗證書」

近日,飛凌嵌入式專為鋰電池儲能行業設計的FCU2601嵌入式控制單元獲得了開普電磁兼容檢驗證書,此次性能檢驗項目包括高頻干擾檢驗、靜電放電干擾檢驗、輻射電磁場干擾檢驗、快速瞬變脈沖群干擾檢驗、浪涌干擾檢驗、工頻磁場干擾檢驗、阻尼振蕩磁場干擾檢驗…

基于docker實現MySQL主從復制(全網最詳細!!!)

一、 通過docker鏡像搭建MySQL主從 主服務器:容器名zi-mysql-master,端口3306 從服務器:容器名zi-mysql-slave1,端口3307 從服務器:容器名zi-mysql-slave2,端口3308 二、 關閉防火墻,啟動docker…

免費百度快速收錄軟件

在網站SEO的過程中,不斷更新網站內容是提升排名和吸引流量的關鍵之一。而對于大多數網站管理員來說,頻繁手動更新文章并進行SEO優化可能會是一項繁瑣且耗時的任務。針對這一問題,百度自動更新文章SEO工具應運而生,它能夠幫助網站管…

基于R語言APSIM模型進階應用與參數優化、批量模擬教程

原文:基于R語言APSIM模型進階應用與參數優化、批量模擬教程 前沿 隨著數字農業和智慧農業的發展,基于過程的農業生產系統模型在模擬作物對氣候變化的響應與適應、農田管理優化、作物品種和株型篩選、農田固碳和溫室氣體排放等領域扮演著越來越重要的作…

全域營銷、全員營銷與霸詞、霸屏、霸網:揭秘數字營銷的五大核心策略

全域營銷、全員營銷與霸詞、霸屏、霸網:揭秘數字營銷的五大核心策略 隨著科技的飛速發展和互聯網的深度滲透,數字營銷已成為企業品牌推廣和市場拓展的必備手段。全域營銷、全員營銷、霸詞、霸屏和霸網這五大策略,更是引領著數字營銷的新潮流…

CCF-A類 IEEE VIS‘24 3月31日截稿!探索可視化技術的無限可能!

會議之眼 快訊 IEEE VIS (IEEE Visualization Conference )即可視化大會將于 2024 年 10月13日 -18日在美國佛羅里達州皮特海灘的信風島大海灘度假舉行!圣彼得海灘,以其迷人的日落和和煦的微風,作為激發創造力和促進可視化社區內合作的完美背…

工廠模式 詳解 設計模式

工廠模式 其主要目的是封裝對象的創建過程,使客戶端代碼和具體的對象實現解耦。這樣子就不用每次都new對象,更換對象的話,所有new對象的地方也要修改,違背了開閉原則(對擴展開放,對修改關閉)。…

使用Gson解析數組類型的JSON字符串

要使用Gson解析數組類型的JSON字符串,首先需要創建一個Java類來表示這個數組中的數據類型。例如,假設我們要解析的JSON數組如下: [{"name": "John Doe","age": 35},{"name": "Jane Smith"…

win中刪除不掉的文件,火絨粉碎刪除親測有效

看網上的 win R 然后終端輸入什么刪除的,照做了都沒有刪掉 有火絨的可以試試: 拖進去就刪掉了 很好使

選項 打光 試題總結

試題1 被測物體100100mm,精度要求被測物體 ,精度要求0.1mm,相機距被測物體在200~320mm之間,要求選擇合適的相機和鏡頭? 分析如下: 通常我們用的相機靶面是4:3 的所以我們要用短邊來計算視場&am…

Jmeter系列(5)線程數到底能設置多大

疑惑 一臺設備的線程數到底可以設置多大? 線程數設置 經過一番搜索找到了這樣的答案: Linux下,2g的 java內存,1m 的棧空間,最大啟動線程數2000線程數建議不超過1000jmeter 能啟動多少線程,由你的堆內存…

CSS常用選擇器及注意事項

CSS選擇器是CSS中的基本概念,用于選擇頁面上要樣式化的元素。下面詳細介紹CSS中所有的選擇器、使用方法及注意事項。 1. 基本選擇器 通用選擇器(Universal Selector):*,選擇頁面上的所有元素。元素類型選擇器&#x…