遷移學習自我學習

??????? 最近在看Ng的深度學習教程,看到self-taught learning的時候,對一些概念感到很陌生。作為還清技術債的一個環節,用半個下午的時間簡單搜了下幾個名詞,以后如果會用到的話再深入去看。

??????? 監督學習在前一篇博客中討論過了,這里主要介紹下遷移學習、自我學習。因為監督學習需要大量訓練樣本為前提,同時對訓練樣本的要求特別嚴格,要求訓練樣本與測試樣本來自于同一分布。要是滿足不了這要求咋辦?那您看看下面幾種學習方法能不能幫上忙吧。

  • ?遷移學習 transfer learning

??????? 有時候困擾大家的一個問題在于訓練數據的標定。這將會耗費大量的人力與物力。另外,機器學習假設訓練數據與測試數據服從相同的數據分布。然而許多情況下,這種同分布假設并不滿足。通常可能發生的情況如訓練數據過期,也就是好不容易標定的數據要被丟棄,而另外有一大堆新的數據要重新標定。遷移學習的目標是將從一個環境中學到的知識用來幫助新環境中的學習任務。講白了,就是當前只有少量新的標記的數據,但是有大量舊的已標記的數據(甚至是其他類別的有效數據),這時通過挑選這些舊數據中的有效的數據,加入到當前的訓練數據中,訓練新的模型。用一句原話則是:

???????Transfer learning is what happens when someone finds it much easier to learn to play chess having already learned to play checkers, or to recognize tables having already learned to recognize chairs; or to learn Spanish having already learned Italian。

?????? 遷移學習的代表作是《Boosting for Transfer Learning》有關它的介紹可以看這里,我就不多說啥了,多的我也不懂。

  • 自我學習 self-taught learning?

?????? ?自我學習和半監督學習一樣,當前手頭上只有少量訓練樣本,但是周圍手頭上還有大量無標注樣本。舉一個經典的例子,分離大象和犀牛。對于監督學習來說,我們手頭有大量大象的樣本和犀牛的樣本,接下來訓練分類器,進行分類,大家都知道的。對于遷移學習,則是指我們手頭上有大量羊的樣本和馬的樣本(已標記),少量的大象和犀牛的樣本,接下來就要從羊和馬的樣本中選出有效的樣本分別加入到大象和犀牛的標記樣本中,然后再用監督學習的方法訓練分類器。而非監督學習,則是手上僅有少量大象和犀牛的已標記樣本,另外有一堆大象和犀牛的沒有標記的數據(注意它們中要么是大象要么是犀牛,沒有其他物種)。半監督學習就是利用這些樣本訓練分類器,實現分類。而自我學習,同樣是手上僅有少量大象和犀牛的已標記樣本,另外有一大堆自然圖像。所謂自然圖像,就是有大象和犀牛的圖片,還有各種其他物種的圖片。自我學習比半監督學習更適合實際場景-----哪有一堆只有大象和犀牛的圖片給你呢?而自然圖像的來源更加廣泛,可以從互聯網上隨便下載。

?????

?????? 自我學習實現的方法如下圖所示。首先通過未標注的自然圖像提取一組特征(如稀疏字典,sparse coding,很神奇的一個東西,以后還會再研究)。這樣任何一個標注和未標注的圖像都可以用這組特征表示出來。由于每一個標注后的樣本都被表示成了這些特征------注意這些特征捕捉了圖像的高層結構,將表示后的標注的樣本訓練一個分類器進行分類。

?
參考資料:
1.???Boosting for transfer learning
2.???Self-taught learning: transfer learning from unlabeled data
?
轉載請注明出處:http://blog.csdn.net/jiang1st2010/article/details/8901261
?

轉載于:https://www.cnblogs.com/jiang1st2010/archive/2013/05/08/3076333.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/259776.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/259776.shtml
英文地址,請注明出處:http://en.pswp.cn/news/259776.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

堰流實驗報告思考題_堰流流量系數測定實驗

二、實驗操作部分1.實驗操作過程(可用圖表示)2.實驗數據、表格及數據處理3.結論1.實驗步驟(1)放水之前,用活動測針測出堰前槽底高程▽低和堰頂高程▽堰頂,堰高P▽堰頂-▽底。(2)關閉首部的泄水閥,打開進水閥…

WCF全雙工以及用戶名密碼驗證

WCF是支持TCP雙向連接的,支持Server和Client之間互發協議,通過 訂閱-發布 的全雙工形式實現,全雙工的用戶名密碼驗證需要X509證書加密,單工模式的用戶名密碼驗證時,X509證書是可選的。 在全雙工模式下,會有…

MTV: Django眼中的MVC

URLconfMTV:Django眼中的MVC MVC是眾所周知的模式,即:將應用程序分解成三個組成部分:model(模型),view(視圖),和 controller(控制 器)。其中:M 管理應用程序的狀態(通常存儲到數據庫中),并約束改…

createbitmap導致的內存泄漏如何處理_C++ 如何避免內存泄漏,一篇就夠

前言近年來,討論 C 的人越來越少了,一方面是由于像 Python,Go 等優秀的語言的流行,另一方面,大家也越來越明白一個道理,并不是所有的場景都必須使用 C 進行開發。Python 可以應付大部分對性能要求不高的場景…

Visio繪制功能分解圖

為什么要繪制功能分解圖? 對于編程人員來說,具體分配任務的時候,必須知道自己要做什么,必須了解系統的大體框架。功能分解圖可以幫助我們理清程序的框架,便于大局觀的掌握。 用Visio2010創建功能分解圖 1、選擇模版 2、…

Heka:Go編寫,來自Mozilla,高效、靈活的插件式數據挖掘工具(轉)

轉自:http://www.csdn.net/article/2013-05-02/2815116-introduce-from-mozilla-heka-go摘要:一直崇尚開源的Mozilla近日釋放了Heka測試版——插件架構,Go編寫。在支持使用Go擴展功能的同時,還通過允許“Sandboxed Filters”提供了…

cocos2d學習筆記2——學習資源

1. 視頻 找了好幾個視頻,有一些講得好的文件資源沒有,后來終于找到一個講得不錯還有文件資源的,還有高清下載地址,雖然是2.2版本的,但是確實能學到不少東西,對用cocos2d做游戲有了基本的印象,對…

深究標準IO的緩存

前言 在最近看了APUE的標準IO部分之后感覺對標準IO的緩存太模糊,沒有搞明白,APUE中關于緩存的部分一筆帶過,沒有深究緩存的實現原理,這樣一本被吹上天的書為什么不講透徹呢?今天早上爬起來趕緊找了幾篇文章看看&#x…

環境變量_配置JAVA環境變量

本文標識 : J00001本文編輯 : YiKi編程工具 : IDEA閱讀時長 : 3分鐘什么是環境變量?環境變量是在操作系統中一個具有特定名字的對象, 它包含了一個或者多個應用程序所將使用到的信息。為什么要配置環境變量?為了方便在控制臺編譯和運行java程序,不…

GotFocus和PreviewLeftButtonDown事件

當TextBox獲得焦點后,其中的文字會被全選。通過GotFocus和PreviewLeftButtonDown事件,就可以模擬上述行為。 如果用戶只是用鍵盤操作,GotFocus事件就足夠了。 如果使用鼠標操作,就要用到2個事件了。TextBox會將光標放在鼠標單擊的…

模式主節點ORACLE DG介紹(物理無實例)

在本文中,我們主要介紹模式主節點的內容,自我感覺有個不錯的建議和大家分享下 DG的三種模式: 硬件以及操縱系統需求: 每日一道理 流逝的日子像一片片凋零的枯葉與花瓣,漸去漸遠的是青春的純情與浪漫。不記得曾有多少雨飄在胸前風響在耳畔&…

分布式消息隊列 Kafka

分布式消息隊列 Kafka 2016-02-25 杜亦舒Kafka是一個高吞吐量的、分布式的消息系統,由Linkedin開發,開發語言為scala具有高吞吐、可擴展、分布式等特點 適用場景 活動數據統計活動數據包括頁面訪問量(Page View)、被查看內容方面的…

漫游飛行_手機“飛行模式”為何沒被淘汰?內行人坦言:其實是你不會用!

隨著科技的不斷創新,目前市面上出現的手機款式多種多樣,品牌也非常多,有華為、蘋果、三星和小米等等。手機的屏幕也是五花八門,有劉海屏、水滴全面屏等,這些屏幕之間都各有不同。而且手機的更新換代速度很快&#xff0…

multiselect多選下拉框

具體實現 <input type"hidden" id"q_dueDay" name"q_dueDay" value"${baseQueryBean.q_dueDay}">//這個為隱藏域后臺直接使用這個為參數 <select id"example" name"example" multiple"multiple&qu…

序列元素IT面試題——判斷合法出棧序列

本文純屬個人見解&#xff0c;是對前面學習的總結&#xff0c;如有描述不正確的地方還請高手指正~ 在技巧筆試口試上&#xff0c;我們常常會碰到這樣一類題型&#xff0c;如給你一個入棧序列&#xff0c;然后再讓你判斷幾個序列是否有可能為它的出棧序列&#xff0c;如&#xf…

scikit-learn點滴

scikit-learn點滴 scikit-learn是非常漂亮的一個機器學習庫,在某些時候,使用這些庫能夠大量的節省你的時間,至少,我們用Python,應該是很難寫出速度快如斯的代碼的. scikit-learn官方出了一些文檔,但是個人覺得,它的文檔很多東西都沒有講清楚,它說算法原理的時候,只是描述一下,除…

background image

http://www.ajaxblender.com/bgstretcher-2-jquery-stretch-background-plugin-updated.html http://blog.dvxj.com/pandola/jQuery_bgStretcher.html 轉載于:https://www.cnblogs.com/eebb/p/4077231.html

怎樣搭建Android開發平臺(轉)

Android是基于Linux內核的軟件平臺和操作系統&#xff0c;是Google在2007年11月5日公布的手機系統平臺&#xff0c;早期由Google開發&#xff0c;后由開放手機聯盟&#xff08;Open Handset Alliance&#xff09;開發。 它采用了軟件堆層&#xff08;software stack&#xff0c…

mvn deploy 推送到私有倉庫,注意當前日期

由于更改了本機系統時間到過去的一個時間&#xff0c;導致mvn deploy推送到私有倉庫后&#xff0c;該更新的jar包時間戳比較舊&#xff0c;客戶端不能更新得到新的jar包。轉載于:https://www.cnblogs.com/silva/p/6264458.html

我的世界1.7.10java32位_我的世界1.7.10中文版

不知道怎么下載&#xff1f;點我游戲介紹《我的世界1.7.10》中整個世界由各種方塊構成&#xff0c;玩家可以破壞它們&#xff0c;也可以用自己的方塊隨意建造東西。為了在游戲里生存和發展&#xff0c;玩家需要通過伐木、挖礦、捕獵等方式獲取資源&#xff0c;并通過合成系統打…