大數據時代下的遷移學習_繼深度學習后,下一個熱點技術是遷移學習

最早提出大數據時代到來的是知名咨詢公司麥肯錫,麥肯錫稱:“數據,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對于海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來。”

其實大數據無論在哪一領域都存在已有時日,卻在近年來的互聯網和信息產業的發展之下得以聚合、得以提煉分析。

要做到人工智能,背后需要有豐富的大數據做支撐。億歐8月12日在CCF GAIR全球人工智能與機器人峰會上聽取了香港科技大學教授、人工智能和數據挖掘專家楊強的主題分享,有關“人工智能成功的幾個條件”,其中分享了幾個很有意思的觀點,億歐對其進行整理補充,分享如下。

AI成功的5大必要條件

1、清晰的目標,商業模式,離不開領域對目標很好的理解;

2、需要高質量的大數據,這個數據要持續反饋,這使得學習不斷提高,推的數據質量高,要與算法不斷匹配,樣本要針對算法手機,要持續得到,數據的標記是非常昂貴;

3、清晰的問題定義和領域邊界;

4、懂人工智能的跨界人才,懂智能懂商業,身邊善于學習的人,可以將兩個不同的垂直領域鏈接到一起,擅長應用和算法;

5、計算能力。

把人工智能往前推一步,繼深度學習之后哪些技術會是下一個熱點?

互聯網泡沫、大數據的驅動下,機器學習以及人工智能領域在后臺的支撐力度越來越大。深度學習之后會有哪些技術是下一個熱點?楊強提出了三明治結構學習法,分別為遞歸深度神經網絡RNN、強化學習RL、以及遷移學習TL。

遞歸深度神經網絡RNN最早是在1992年由施米德林(DeepMind聯合創始人、深度學習四大巨頭之一)和他的學生團隊提出的,非監督學習時間遞歸神經網絡,為語音識別和自然語言翻譯提供了重要的模型。

強化學習(ReinforcementLearing),就是智能系統從環境到行為映射的學習,以使獎勵信號(強化信號)函數值最大,強化學習不同于連接主義學習中的監督學習,主要表現在教師信號上,強化學習中由環境提供的強化信號是對產生動作的好壞作一種評價(通常為標量信號),而不是告訴強化學習系統RLS(reinforcement learning system)如何去產生正確的動作。由于外部環境提供的信息很少,RLS必須靠自身的經歷進行學習。通過這種方式,RLS在行動-評價的環境中獲得知識,改進行動方案以適應環境。什么是遷移學習?即在源領域已經擁有大量數據,并且在源領域能對數據進行很好的應用建立了模型后,我們換一個領域也能讓它使用,這樣既節省了資源,又達到時間和效果的好處,就叫做遷移學習。這就很像人的舉一反三的學習能力,比如我們學會騎自行車以后,我們又去學摩托車,發現很簡單,我們打球、學語言、學物理化學也有很多這樣的例子。

實現遷移學習的方法有四種:1)樣本遷移;2)特征遷移;3)基于模型的遷移學習;4)通過關系進行遷移,比如社交網絡。

第一種就是我們在數據集里面找到跟目標領域相似的數據,把這個數據放大多倍,這個叫做樣本遷移,通過樣本來達到遷移的目的。其次我們可以觀察到有些相似的特征,然后利用這些特征,在不同的層次的特征,來進行自動的遷移,這種叫做特征遷移。然后我們還可以做到基于模型的遷移,這是這樣的一個工作。利用上千萬的圖象來訓練一個圖象識別的系統,我們遇到一個新的圖象領域,我們就不用再去找幾千萬個圖象來訓練了,我們就把原來的那個遷移到新的領域,所以在新的領域只用幾萬張圖片就夠,同樣可以得到很高的效果,這叫做模型遷移,模型遷移的一個好處是我們可以區分,就是可以和深度學習結合起來,我們可以區分不同層次可遷移的度,相似度比較高的那些層次他們被遷移的可能性就大一些。最后我們也可以通過關系來進行遷移,比方說社會網絡,社交網絡之間的遷移。

一個不爭的事實,大數據只有富人才能得到

深度學習是離不開大數據的,大數據又離不開大公司,我們所熟知的大公司都是大數據的擁有者,而中小型的公司是沒有大數據的,也沒有獲取大數據的能力。

要做到深度學習,離不開對特征的選取,特征的選取又離不開大數據,而這些大數據只有富人才能得到。

數據在哪里?領域到底有沒有大數據?錢在哪里?

“數據在的地方,我們要看有沒有錢來驅動我們去做人工智能的研究工作。哪些領域的錢已經準備好了?這里我要提出一個概念叫封閉系統,剛才我講邊界清晰問題定義非常清晰就是指的這樣一個封閉系統,就是說整個的商業流程都有數據的腳印,全部的留下來,我們看一下,我們今天在教育領域到底有沒有這樣的數據,我們在出行的領域有沒有這樣的數據,我們在金融、醫療的領域,所以在這些領域里面我覺得比較看好的一個是金融的領域,因為在金融里面每一步都太關鍵太重要了,所以在很早以前就有很多人把所有的整個的商業流程全部的記錄在案,用數字化的方法,只不過存在那里沒有在用。雖然有很多不同的政治、經濟角度在來影響它,但是大家不要忘記人工智能的商業成功只要系統比人好一點點就可以了,就像在奧運會里面我們得到的金牌比銀牌好一點點就可以了,所以在信息的處理和未來的預測方面,如果在一個封閉系統里面,在有大數據的前提,又有資金推動的影響下,我覺得這個領域差不多就會成功了。”

人工智能不能關在象牙塔里面

早在2013年香港科技大學和張小龍的微信一起成立了一個聯合實驗室。“微信為我們提供非常好的平臺,我們做人工智能不能關在屋子里,不能拿一個象牙塔的姿態來做,一定要放開胸懷,讓我們做的東西能夠鋪會越多的人去用,去讓他們能夠受益越好。”楊強說到,“微信提供了平臺,特別難的學術問題我們會自己留下來,我們會給微信提供資源,我們有十幾個教授,我們實驗室從機器人到自然語言處理、語音識別、圖像處理、圖像識別、包括對話系統等等。在這樣互相受益的情況下做這樣一個實驗室我們才覺得是一個雙贏,是一個有很好的情景。”

看好的下一個商業方向

人工智能到現在為止最成功的一個領域就是機器學習。

機器學習的基本概念就是從數據里面經常重復的現象學出規律來,人工智能在商業上面應用的一個很強烈的特征,就是,我們要去觀察我們商業活動當中哪一些數據能夠讓我們替代掉人類簡單、重復、繁瑣的這類工作。然后那些奇思妙想、創新的東西就交給人類, 人類能給人工智能當老師。

在楊強看來,下一個最看好的商業方向,便是將人和機器進行有機結合的領域。

本文作者吳妙蕓,億歐專欄作者。本文轉載自 億歐網

天云大數據

天云大數據是專注于大數據分布式計算平臺軟件、AI算法的國家高新科技企業。孵化并成長于北京云基地的天云大數據是北京祥云工程代表企業,作為秘書長或理事成員參與了中國云產業聯盟,中關村大數據產業聯盟,國家統計局大數據戰略合作企業,中關村-濱海大數據產業技術創新戰略聯盟,上海大數據產業技術創新戰略聯盟的籌建。被硅谷GigaOM大數據先鋒評論冠以改變中國云計算最有影響力的企業;幫助某全國性股份制商業銀行獲得了國際化組織IDC的“2014年度中國金融行業最佳創新項目”大獎;2016年榮選由畢馬威評選的中國領先金融科技公司50強企業。

更多精彩內容請關注微信公眾號:BeagleData_

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/260034.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/260034.shtml
英文地址,請注明出處:http://en.pswp.cn/news/260034.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

手機廣告投放(phone advertising)唯一標識

手機標示,為了識別用戶,方面advertising。 使用設備id,相當于暴露用戶隱私。慢慢已不允許使用。、 (長時間跟蹤用戶無異于暴露用戶隱私,雖然大量數據適合興趣建模,廣告個性化推薦。但復雜多樣會降低總體的準…

android分辨率比例成像,像素不是唯一 決定成像效果你必知的真相

像素并不是唯一如今不少人在選購一部手機時,非常重視手機攝像頭的像素大小,因為一部高像素的手機可以為不少喜愛拍照的人省去買單反的費用,而且攜帶起來也非常方便。不過,手機并不能與專業的單反相機相比,成像效果并不…

vim——打開多個文件、同時顯示多個文件、在文件之間切換

打開多個文件: 1.vim還沒有啟動的時候: 在終端里輸入 vim file1 file2 ... filen便可以打開所有想要打開的文件 2.vim已經啟動 輸入 :open file 可以再打開一個文件,并且此時vim里會顯示出file文件的內容。 同時顯示多個文件: :s…

Android底部導航欄實現(一)之BottomNavigationBar

BottomNavigationBar這個控件的使用之前已經寫過,這里不再贅述,詳情請參考BottomNavigationBar的使用。 下面直接上代碼: 初始化及相關設置: mBottomNavigationBar (BottomNavigationBar) view.findViewById(R.id.bottom_navigat…

jq 組裝數組_Jquery 數組操作

1、數組的創建var arrayObj new Array(); //創建一個數組var arrayObj new Array([size]); //創建一個數組并指定長度,注意不是上限,是長度var arrayObj new Array([element0[, element1[, ...[, elementN]]]]); 創建一個數組并賦值要說明的是&…

android 官方說明文檔,Android官方文檔翻譯-Accessibility

標簽元素向用戶提供解釋每個可互動元素的意義和目的有用且形象的標簽是非常重要的。這些標簽允許屏幕閱讀者(比如 TalkBack )正確向用戶解釋每個控制器的功能。你可以使用一下兩個方法提供元素的標簽:當展示在 Activity 的整個生命周期中都不會改變樣式的靜態元素時…

USACO 2.4.1 The Tamworth Two

牛和農夫按照固定的走法在10x10的地圖中走,每分鐘走一步,求經過幾分鐘相遇。永遠不能相遇輸出0. 純模擬的題。 判斷永遠不能相遇的方法是如果遇到了一個先前的狀態,那么肯定存在循環,必定不能相遇。 程序中把狀態表示為牛和農夫的…

013,spring boot下JedisCluster客戶端的配置,連接Redis集群

2019獨角獸企業重金招聘Python工程師標準>>> 1&#xff0c;pom依賴添加&#xff1a; <dependency> <groupId>redis.clients</groupId> <artifactId>jedis</artifactId> <type>jar</typ…

android控件使用大全,Android常見控件使用詳解

本文實例為大家分享了六種Android常見控件的使用方法&#xff0c;供大家參考&#xff0c;具體內容如下1、TextView 主要用于界面上顯示一段文本信息2、Button 用于和用戶交互的一個按鈕控件//為Button點擊事件注冊一個監聽器public class Click extends Activity{private Butto…

Ubuntu 12.10使用apt安裝Oracle/Sun JDK

Ubuntu 12.10使用apt安裝Oracle/Sun JDK apt-get install python-software-properties sudo add-apt-repository ppa:webupd8team/java sudo apt-get update sudo apt-get install oracle-java6-installerposted on 2014-09-05 13:30 fastdream 閱讀(...) 評論(...) 編輯 收藏 …

Afterthought 原來是這樣的啊。。。。

$(ProjectDir)Libs\Afterthought\Afterthought.Amender.exe "$(TargetPath)" "$(TargetDir)EntityFramework.Patterns.dll" 我實際上分析代碼好久&#xff0c;也沒整明白它是怎么運行的&#xff0c;看一下官方文檔明白了&#xff0c;原來。。。 Next, add …

查詢

增加文本1. create database test刪除文本2. drop database test3. create table info( code int primary key, name varchar(20) not null)auto_increment 自增長列foreign key(列名) references 主表名(列名) 外鍵關系4. drop table infoCRUD:增加語法1.insert into 表…

android 監聽界面變化,Android之頁面有變化用onWindowFocusChanged來監聽權限是否開啟...

1 問題我們需要在Activity里面監聽網絡變化、熱點是否開啟和關閉、GPS服務是否開啟、位置權限是否開啟等一些列行為。2 思路方法一&#xff1a;如果是需要啟動activity進行權限申請&#xff0c;我們可以用如下組合模式var intent Intent(Settings.ACTION_LOCATION_SOURCE_SETT…

逐步優化求解最大子序列和

求解最大子序列和 tag&#xff1a; 數據結構與算法 最大子序列和問題&#xff1a; 給定序列A1, A2&#xff0c;... AN&#xff0c; 求最大的子序列和。 例如 &#xff1a;   對于序列4, -3, 5, -2, -1, 2, 6, -2&#xff0c; 最大序列和為11&#xff08;4 -3 5 - 2 - 1 2 …

POJ 1228 —— “穩定”凸包

POJ 1228 Grandpas Estate 這是個好題目&#xff0c;同時也是個不和諧的題目&#xff08;不和諧原因是題目出的存在漏洞&#xff0c;數據弱&#xff0c;而且有些條件沒給清楚&#xff0c;為了一個SB錯誤無限WA之后&#xff0c;終于AC&#xff09; 題意就廢了我好長時間&#xf…

pythonflaskmock數據_Flask實現簡單Mock Server

Mock Server充當的角色&#xff1a;Mock server在實際項目中的意義就相當于數據庫。將我想要的數據返回給我就行&#xff0c;我并不關心你怎么邏輯處理的。一般的應用程序請求方式是GET和POST。Flask自帶的request使用:request.url獲取當前的請求url全路徑地址&#xff0c;requ…

在Application_Error事件中獲取當前的Action和Control

ASP.NET MVC程序處理異常時&#xff0c;方法有很多&#xff0c;網上也有列舉了6種&#xff0c;下面是使用全局處理在Global.asax文件的Application_Error事件中實現。既然是ASP.NET MVC,我需要捕捉到Controller和Action名稱。怎樣實現可以參考下面代碼&#xff1a; 程序運行結果…

android 真機 sqlite3,在android真機上使用sqlite3

#zijun#2013.10.29#QQ:223663737在android真機上使用sqlite3前期準備:1:保證手機已經ROOT操作步驟:1 : 打開CMD2 : 進入android linuxadb shell3 :切換到root權限su - root4 : 修改system目錄為可讀寫權限mount -oremount,rw -t yaffs2 /dev/block/mtdblock3 /system5 :拷貝文件…

【ORACLE技術嘉年華PPT】MySQL壓力測試經驗

這是2013.11.18在第三屆ORACLE技術嘉年華上的主題演講PPT。點擊這里&#xff1a;本地下載PPT。--------------------------------------分割線--------------------------------------知數堂 &#xff08;http://zhishuedu.com&#xff09;培訓是由資深MySQL專家葉金榮、吳炳錫…

EditText 空指針問題

今天在Android中碰到了這樣一個問題&#xff0c;其實應該很少人會碰到&#xff0c;因為只有像我這種奇葩才會犯這種錯誤。 但既然解決了&#xff0c;我就想在這里跟大家分享一下&#xff0c;畢竟它困擾了我一個白天啊。。。不多說了&#xff0c;看下面。。。 其實問題很簡單&am…