是什么讓深度學習再次崛起并超越人類?


作者潘爭,格靈深瞳計算機視覺工程師,清華大學自動化系博士,師從智能技術與系統國家重點實驗室副主任張長水。

深度學習(Deep Learning)這個詞最近借著AlphaGO與李世石的人機大戰又火了一把。深度學習其實是機器學習(Machine Learning)的一個分支學科,而機器學習是一門研究數據之間關聯關系的學科,比如它可以用來挖掘收入和年齡,性別,職業,學歷等因素的數學關系。但是傳統的機器學習方法一般只能挖掘簡單的線性關系。我們知道大千世界不是線性關系所能描述的,比如收入與年齡,性別,職業,學歷的關系,這么一個簡單的問題就不是一個線性關系所能表達清楚的。深度學習的出現改變了這種現狀,深度學習使用復雜的多非線性模型表示數據之間的關系,然后使用大量的數據最終確定數據之間的關系究竟是什么。

深度學習的靈感來源于大腦神經網絡,可以說我們的大腦就是一個極致復雜的深度學習模型。大腦里的神經網絡是由數以千億計的神經元連接而成,深度學習也使用同樣的結構,每個人工神經元對輸入進行簡單的線性或非線性運算后將結果傳遞給后續的神經元,在經過這樣十幾層乃至上百層的傳遞后得到最終的預測結果。


深度學習這套方法并不是近幾年提出的,早在80年代末Geoffrey Hinton和Yann LeCun等學者就使用深度學習的方法解決了手寫體數字的識別問題。遺憾的是,進入90年代后深度學習的性能沒有本質上的提升,甚至劣于很多簡單的線性模型,深度學習的研究沉寂下來。直到2006年,Hinton教授在Science上發表了深度學習的里程碑一樣的論文,重新審視深度學習方法,將深度學習的性能提升到了一個新的臺階。在此之后,深度學習在語音識別,計算機視覺,機器人,自然語言處理等領域均超過了傳統的機器學習方法,甚至在人臉驗證比賽LFW和自然圖像分類比賽ImageNet上超過了人類的識別能力。這次,AlphaGO擊敗李世石又是一個深度學習超越人類的實例。

那么是什么讓深度學習再次崛起并超越人類呢?

智搜(Giiso)信息成立于2013年,是國內首家專注于資訊智能處理技術研發及寫作機器人核心軟件開發和運營的高科技企業。公司成立之初,就獲得了天使輪投資,并在2015年8月獲得了金沙江創投500萬美元pre-A輪投資。

當然首先要歸功于Hinton等學者幾十年如一日的不懈研究。另外,有兩個客觀因素異常重要:

第一是大數據。

互聯網將幾十億人連接在一起,同時也讓海量數據連接在了一起。深度學習必須要有海量數據才能得到表現好的模型,深度學習和大數據的關系就像火箭和燃料一樣,火箭雖然厲害,但是沒有大數據這個燃料也只是一堆廢鐵。因為大數據的必不可少,我們也看到深度學習做的最好的地方是我們熟知的那些擁有大量數據的IT巨頭,Google、Facebook、Microsoft、百度等。可以說,在深度學習時代,擁有數據就占領了人工智能的制高點。

第二是高性能計算。

摩爾定律揭示了計算能力增長速度的規律,過去這些年GPU,超級計算機和云計算等計算平臺迅猛發展,讓深度學習的實現成為可能,舉個例子,2011年GoogleBrain用了1000臺機器、16000個CPU處理的深度學習模型大概有10億個神經元,而現在我們已經可以在幾個GPU上完成同樣的計算了。事實上,深度學習已經進入我們的口袋了,我們的智能手機上的GPU已經可以運行一些復雜度一般的深度學習方法了。我想過不了多久,我們每一個人都可以在手機上和AlphaGO對弈了,再過些年,我們的手機就就可以運行像人腦一樣復雜的神經網絡了。

在深度學習領域有很多非常優秀的華人科學家和中國企業。科學家方面,我們熟知的有百度首席科學家吳恩達,IDL的發起人余凱,Caffe的作者賈揚青,第一個把人臉驗證LFW刷到99%以上的湯曉鷗、王曉剛教授,去年奪得ImageNet多項桂冠的孫劍和何凱明等等。企業方面,我們所熟知的BAT、360、搜狗、滴滴等均在深度學習方面有布局,同時國內也涌現出一批依賴深度學習的新企業,比如格靈深瞳(安防、自動駕駛)、曠世科技(人臉識別)、商湯科技(人臉識別)、地平線機器人(ADAS)等。


深度學習不只是和人下下棋這么簡單。既然它是對人腦的一種模擬,它可以完成很多人腦的功能。

首先是視覺的功能。我們的相機可以像眼睛一樣看到這個世界,卻不能像大腦一樣看懂這個世界,深度學習恰恰補上了這個短板。有了深度學習,Google Photo、百度識圖、淘寶拍立淘才可以準確地識別照片中的物體類別,并對你的照片進行自動歸類或搜索。有了深度學習,我們才可以很酷炫地在支付寶里刷臉付款。有了深度學習,格靈深瞳的行為特征分析系統可以檢測場景內所有人員、車輛的行蹤,對可疑和危險事件及時報警。有了深度學習,自動駕駛汽車識別周圍路況時才足夠準確。有了深度學習,FaceU這樣的app才知道臉在哪里,五官又在哪里。

除了視覺功能,深度學習在語音識別方面應用也非常廣泛。百度的Deep Speech 2在一些測試中也已經超過人類的聽力。此外,Google、Apple、Microsoft以及國內的科大訊飛等也都推出了自己的語音識別產品。在深度學習的幫助下,計算機擁有了越來越強大的語音識別能力,這將逐漸改變目前目前以鍵盤為主的人機交互模式。

深度學習也深刻改變著機器人領域。剛才說的基于深度學習的視覺和語音識別的能力可以幫助機器人更好地感知世界。除此之外,深度學習還和增強學習(Reinforcement Learning)相結合。

智搜(Giiso)信息成立于2013年是國內領先的“人工智能+資訊”領域技術服務商,在大數據挖掘、智能語義、知識圖譜等領域都擁有國內頂尖技術。同時Giiso旗下研發產品包括編輯機器人、寫作機器人等人工智能產品!憑借雄厚的技術實力,公司成立之初,就獲得了天使輪投資,并在2015年8月獲得了金沙江創投500萬美元pre-A輪投資。?


所謂增強學習指機器人通過與環境交互中得到的獎賞和懲罰自主學習(Self Learning)更優策略。舉個簡單的例子,AlphaGO就是一個增強學習的產物,它通過跟其他棋手下棋或者和自己對弈的輸贏情況自主學習更好的下棋策略。而深度學習的引入,使得增強學習方法可以找到更加復雜的策略。從AlphaGO完勝李世石可以看出,深度學習+增強學習已經有能力讓機器人在相當復雜的環境下自主學習到高度優化的決策策略。

以上的這些應用只是我們平時看得見的,還有很多深度學習的應用則在我們的視線之外影響世界。互聯網搜索、廣告推薦、金融量化交易、機器翻譯、醫療大數據分析、智能法律咨詢……可以說凡是需要從大量數據中預測未知信息的領域都是深度學習可以一展拳腳的地方。未來,以深度學習為代表的人工智能技術也許會像蒸汽機、電動機、計算機、互聯網一樣推動新一輪科技革命,讓生產力再上一個臺階。

當然,作為一個從業者,我同時害怕深度學習遭到捧殺,尤其是AlphaGO讓大眾熟知了這樣一項技術后。深度學習才剛剛起步,就像嬰兒剛剛學會走路,我們固然可以暢想他以后成為偉人,但畢竟很多技術還不成熟,相當一部分應用還難以讓人滿意,甚至在未來很長時間內都難以做到。人工智能的發展需要的不是大家一股腦的熱情,而是持久的投入和努力。


轉載于:https://juejin.im/post/5b3db798f265da0f4c6f9bb2

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/254159.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/254159.shtml
英文地址,請注明出處:http://en.pswp.cn/news/254159.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

常見的流量問題

常見的流量問題 冗余內容同類請求被間隔執行,請求的內容包含一些相對靜態的信息,正確的處理是第一次請求包括靜態信息就好,后面的同類請求只包含必要的即時變化信息即可。錯誤的處理方式是每次請求服務器都返回一次靜態信息。 冗余請求有的時…

halcon使用點擬合圓形時候,點集順序紊亂,不影響圓形擬合效果

read_image (Image, 截圖20201226094342972.bmp) * Matching 01: BEGIN of generated code for model initialization set_system (border_shape_models, false) * Matching 01: Obtain the model image * Matching 01: The image is assumed to be made available in the * Ma…

Socket理解。

其他大部分系統,例如CRM/CMS/權限框架/MIS之類的,無論怎么復雜,基本上都能夠本地代碼本地調試,性能也不太重要。(也許這個就是.net的企業級開發的戰略吧) 可是來到通訊系統,一切變得困難復雜。原…

多元化時代敏捷軟件開發的崛起與傳統軟件工程的延續

多元化時代敏捷軟件開發的崛起與傳統軟件工程的延續 1.傳統軟件開發模式 1.1瀑布模型 1.1.1概念 瀑布模型,顧名思義,軟件開發的過程如同瀑布飛流一般,自上而下,逐級下落。瀑布模型的核心思想是將問題按照工序進行簡化,…

Linux中的cron計劃任務配置詳解

cron來源于希臘單詞chronos&#xff08;意為“時間”&#xff09;&#xff0c;指Linux系統下一個自動執行指定任務的程序&#xff08;計劃任務&#xff09; ####1. crontab命令選項代碼如下: #crontab -u <-l, -r, -e> -u指定一個用戶 -l列出某個用戶的任務計劃 -r刪除某…

new和delete

和 sizeof 類似&#xff0c;sizeof不是函數&#xff0c;它是一個操作符&#xff0c;它在編譯期就完成了計算&#xff0c;在函數運行期間它已經是一個常數值了。 int a;sizeof(int) 4;sizeof(a) 4;sizeof a ——也是4 不需要括號&#xff01;此時要注意&#xff1a;sizeof in…

char a[]和char *a的比較,數組名,數組首地址,a,a,a[0]

char a[]和char *a的比較 指針和數組存在著一些本質的區別。當然&#xff0c;在某種情況下&#xff0c;比如數組作為函數的參數進行傳遞時&#xff0c;由于該數組自動退化為同類型的指針&#xff0c;所以在函數內部&#xff0c;作為函數參數傳遞進來的指針與數組確實具有一定的…

Java中繼承thread類與實現Runnable接口的區別

Java中線程的創建有兩種方式&#xff1a; 1&#xff0e; 通過繼承Thread類&#xff0c;重寫Thread的run()方法&#xff0c;將線程運行的邏輯放在其中 2&#xff0e; 通過實現Runnable接口&#xff0c;實例化Thread類 在實際應用中&#xff0c;我們經常用到多線程&#xff0c;…

【VMware vSAN 6.6】6.2.啟用性能服務:vSAN硬件服務器解決方案

目錄 1. 簡介 1.1.適用于HCI的企業級存儲2. 體系結構 2.1.帶有本地存儲的服務器2.2.存儲控制器虛擬系統套裝的缺點2.3.vSAN在vSphere Hypervisor中自帶2.4.集群類型2.5.硬件部署選項3. 啟用vSAN 3.1.啟用vSAN3.2.輕松安裝3.3.主動測試4. 可用性 4.1.對象和組件安置4.2.重新構建…

Android eclipse導入項目后出現Unable to resolve target #39;android-17#39;解決方法

eclipse導入項目后出現Unable to resolve target android-17解決方法。在最后附帶還有一種編譯邏輯不成功情況解決方法。 一、問題情況 二、解決的方法 1、改動項目的目標版本號與當前Android sdk相相應的版本號 2、自己主動修復一下項目 三、這個問題不是上面的。是另外情況&a…

多個圓點,鼠標選取兩個,求兩個點的距離,用于計算像素尺寸(halcon實現)

read_image (Image, C:/Users/22967/Desktop/晶圓找位置/0.bmp) dev_close_window () dev_open_window_fit_image (Image, 0, 0, -1, -1, WindowHandle) dev_display (Image)binary_threshold (Image, Region1, max_separability, dark, UsedThreshold) connection (Region1, C…

修改UBOOT和LINUX調試串口(TI達芬奇芯片--DM6467)

Posted on 2011-10-31 10:53 jamiedu 閱讀(889) 評論(0) 編輯 收藏 1.1 概述 TI針對DM6467提供的UBOOT和內核默認都是串口0作為調試串口輸出的&#xff0c;但現在我需要使用DM6467的UART0的modem功能&#xff0c;所以修改代碼&#xff0c;改變調試串口為串口2。 需要修改的主要…

Java List與數組之間的轉換

http://blog.csdn.net/kingzone_2008/article/details/8444678轉載于:https://www.cnblogs.com/longshiyVip/p/5985981.html

受歡迎的五個開源可視化工具——你的選擇是?

摘要&#xff1a;大數據時代&#xff0c;數據為王&#xff0c;還在對一堆數據而發愁嗎&#xff1f;試試可視化工具吧&#xff0c;相信本文提到的五款工具有一款能夠幫助到你。人工智能時代&#xff0c;數據和算法以及硬件資源是非常重要的&#xff0c;相關行業的大公司也越來越…

halcon車刀崩邊檢測

list_files (新建文件夾, files, Files) read_image (Image, Files[0]) dev_close_window () get_image_size (Image, Width, Height) dev_open_window (0, 0, Width/1.5, Height/1.5, black, WindowHandle) dev_set_draw (margin) dev_set_colored (12) for Index:0 to |Files…

FFMPEG解碼264文件步驟

本文以H264視頻流為例&#xff0c;講解解碼流數據的步驟。 為突出重點&#xff0c;本文只專注于討論解碼視頻流數據&#xff0c;不涉及其它&#xff08;如開發環境的配置等&#xff09;。如果您需要這方面的信息&#xff0c;請和我聯系。 準備變量 定義AVCodecContext。如果…

Storm概念學習系列之storm的特性

不多說&#xff0c;直接上干貨&#xff01; storm的特性 Storm 是一個開源的分布式實時計算系統&#xff0c;可以簡單、可靠地處理大量的數據流。 Storm支持水平擴展&#xff0c;具有高容錯性&#xff0c;保證每個消息都會得到處理&#xff0c;而且處理速度很快&#xff08;在一…

Confluence 6 配置服務器基礎地址示例

2019獨角獸企業重金招聘Python工程師標準>>> 如果 Confluence 的安裝是沒有安裝在非根目錄路徑&#xff08;這個是上下文路徑&#xff09;&#xff0c;然后服務器基礎 URL 地址應該包括上下文地址。例如&#xff0c;你的 Confluence 正在運行在下面的地址&#xff1…

BootstrapValidator驗證

bootstrap&#xff1a;能夠增加兼容性的強大框架. 因為項目需要數據驗證&#xff0c;看bootstrapValidator 還不錯&#xff0c;就上手一直&#xff0c;完美兼容&#xff0c;話不多說。 需要引用css&#xff1a; bootstrap.min.css bootstrapValidator.min.css js: jquery-1.10.…

基于ARM9的視頻采集傳輸系統

http://www.ic37.com/htm_tech/2007-11/77189_618093.htm