李飛飛:為什么計算機視覺對機器人如此重要?

根據Guide2Research的排名,IROS是計算機視覺領域排名第四的學術會議,前三名分別為CVPR、ICCV、ECCV。計算機視覺在機器人的發展史中起著非常重要的作用,與之相關的“感知”也正是歷年IROS大會上的重要內容,隨著機器人研究的發展和“越來越接近人類”這個目標的進一步深入,越來越多的學者更深刻認識到了計算機視覺對機器人整個行業發展的重要性。雷鋒網認為,隨著近幾年深度學習在計算機視覺領域的突破,計算機視覺在機器人領域的應用也將會迎來一個新的時期,這也是今年的IROS大會邀請李飛飛教授到IROS做大會報告的原因。

如李飛飛開場所言,這是她第一回參加IROS,但她希望和做機器人研究的朋友們進行交流,分享在她眼中計算機視覺對機器人意味著什么,并介紹她在ImageNet后,與其斯坦福研究團隊正在從事的其他研究項目,而這些項目對未來機器人的感知和認識我們所處的環境尤為重要。

“希望可以說服做機器人研究的朋友,(計算機)視覺是機器人的殺手級應用。”在演講前一天,李飛飛在Twitter上這么說。

由于篇幅限制,報告分為上下兩篇。在上半部分,李飛飛解釋了為什么計算機視覺會是機器人的殺手級應用,雷鋒網(公眾號:雷鋒網)作了不改變愿意的刪減。

李飛飛:為什么計算機視覺對機器人如此重要? | IROS 2017

李飛飛在 IROS 2017

李飛飛:我會與大家分享最近在做的視覺工作,聊一聊計算機視覺與視覺智能領域的歷史背景。這些都是仍在進行中的研究,歡迎自由討論。

視覺究竟有多重要?

朋友建議我,在機器人大會演講至少要放一張機器人的圖片。我挑了一張最喜歡的:

李飛飛:為什么計算機視覺對機器人如此重要? | IROS 2017

問題來了:為什么在這幅兒童畫里,機器人是有眼睛的?

我認為這與進化演進有關。不管是智慧動物還是智能體,眼睛/視覺/視力都是最基本的東西(兒童在潛意識里也這么認為)。讓我們回到 5.4 億年前的寒武紀——在寒武紀生物大爆發之前,地球上的生物種類算不上多,全都生活在水里,被動獲取食物。但在距今約 5.4 億年的時候,非常奇怪的事情發生了(如下圖):短短一千萬年的時間內,各種各樣的新物種紛紛涌現,這便是“寒武紀大爆發”。

李飛飛:為什么計算機視覺對機器人如此重要? | IROS 2017

這背后的原因是什么?

最近,一名澳大利亞學者提出了一套非常有影響力的理論,把寒武紀大爆發歸功于——視覺。在寒武紀,最早的三葉蟲進化出了一套非常原始的視力系統,就像最原始的德科相機,能捕捉到一丁點光。但這改變了一切:能“看”之后,動物開始主動捕食。獵手和獵物之間從此開始了持續數億年的“追蹤—躲藏”游戲,行為越來越復雜。從這個節點往后,幾乎地球上所有動物都進化出了某種形式上的視覺系統。5.4 億年之后的今天,對于人類,眼睛已成為我們最重要的傳感器,超過一半的大腦都會參與視覺功能。

在地球生物向更高智慧水平進化的過程中,視覺真的是非常重要的推動力量。

這套如此神奇的感知系統,便是我今天想要講的主題。這也是我們對機器的追求——讓機器擁有人類這樣的視覺智能。

從人類到機器視覺

下面,我講一個小故事,關于人類視覺系統的令人驚嘆之處。

在 1960 年代的好萊塢,誕生了一個非常有里程碑意義的歷史電影《The Pawnbroker》(首部以幸存者角度表現二戰中猶太人大屠殺的美國電影)?。隨著這部電影誕生了一種全新的為電影插入視頻剪輯的技術,導演 Sidney Lumet 對此做了個很有意思的實驗——插入的畫面需要顯示多久才能讓觀眾抓住內容。

李飛飛:為什么計算機視覺對機器人如此重要? | IROS 2017

他不斷縮短畫面播放的時間,從十幾秒到幾秒,最后到三分之一秒——他發現這是一個相當好的時長,足夠觀眾看清楚并且充分理解畫面。

心理學家和認識科學家們受此啟發,開展了更進一步的實驗:向參與者播放連續多幀畫面,每幀的顯示時間僅有??100 微秒。其中,僅有一幅畫面里有一個人,要求參與者找出這個人。

而大家確實都能夠找出來。這非常令人驚嘆,只需 100 微秒,我們的視覺系統就能檢測到從來沒見過的人。

1996 年,神經心理學家 Simon J. Thorpe 在?《自然》發表了一項研究,通過腦電波觀察人腦對復雜圖像進行分類的速度。他發現,僅需 150 微秒,大腦就會發出一道區分信號,對畫面中的物體是否為動物做出判斷。

李飛飛:為什么計算機視覺對機器人如此重要? | IROS 2017

后來,哈佛人體視覺學者 Jeremy Wolfe 在論文中寫道,雖然很難去衡量一個人究竟看到了什么、對某個畫面達到了什么程度的理解,但直覺告訴我們,畫面中的物體應當是我們觀察的對象之一。

看起來很顯而易見,但這提醒我們,對物體的識別是視覺最基礎的部分之一,計算機視覺也在這個領域攻關了許多年。從 2010 到 2017,ImageNet 挑戰賽的目標識別(object recognition)錯誤率一直在下降。到 2015 年,錯誤率已經達到甚至低于人類水平。

李飛飛:為什么計算機視覺對機器人如此重要? | IROS 2017

我不會說目標識別是個已經攻克的領域。許多關鍵問題尚待研究,其中不少和機器人息息相關。比如 3D 輪廓理解,目標局部理解,對材料、紋理的理解等等。這些方面的研究非常活躍,我也感覺到做這些比組織 ImageNet 分類任務挑戰賽更有意思。

后目標識別時代的計算機視覺

接下來,我想分享一些新的、探索性的工作,而不是列出識別對象清單(inventory list of objects)這樣的基礎研究。讓我們回到 Jeremy Wolfe 的論文,他繼續寫道:“物體之間的關系,必須寫進 gist。”

假設有兩張圖片:把一盒牛奶倒進玻璃杯;把一盒牛奶倒出來(倒在空中),旁邊放著一只玻璃杯。兩者不是一回事。兩張圖片中的物體都一樣,但它們之間的關系不同。

僅憑圖片的對象清單,無法完整傳遞其內容。下面是另一個例子:

李飛飛:為什么計算機視覺對機器人如此重要? | IROS 2017

兩張照片都是人和羊駝,但是發生的事情完全不同。當然,過去在這方面也有不少研究,包括空間關系,行為關系,概率關系等等,就不一一闡述了。這些工作基本都在小型封閉環境中開發測試,探索的也不過十幾、二十幾種關系。而我們希望把視覺關系的研究推向更大的尺度。

我們的工作基于視覺表達和 leverage model 的結合,通過把圖像空間的 embedding 以及關于對象關系的自然語言描述以巧妙的方式結合起來,避免了在對象和對象之間的關系做乘法帶來的計算負擔。

李飛飛:為什么計算機視覺對機器人如此重要? | IROS 2017

上圖展示的便是可視化結果的質量。給定該照片,我們的算法能找出空間關系、比較關系、不對稱空間關系、動詞關系、行為關系以及介詞關系。

更有意思的是,我們的算法能實現 zero-shot (零樣本學習)對象關系識別。舉個例子,用一張某人坐在椅子上、消防栓在旁邊的圖片訓練算法。然后再拿出另一張圖片,一個人坐在消防栓上。雖然算法沒見過這張圖片,但能夠表達出這是“一個人坐在消防栓上”。

李飛飛:為什么計算機視覺對機器人如此重要? | IROS 2017

類似的,算法能識別出“一匹馬戴著帽子”,雖然訓練集里只有“人騎馬”以及“人戴著帽子”的圖片。當然,這個算法還很不完美。例如當兩個類似的對象(如兩個人)部分重疊在一起,算法就容易判斷失誤。如下圖,算法錯誤得認為是左邊的人在扔飛碟:

李飛飛:為什么計算機視覺對機器人如此重要? | IROS 2017

這是一個計算機視覺下面飛速發展的領域。在我們團隊的 ECCV 2016 論文之后,今年有一大堆相關論文發表了出來,一些甚至已經接近了我們的模型效果。我非常欣喜能看到該領域繁榮起來。



本文作者:三川
本文轉自雷鋒網禁止二次轉載,原文鏈接

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/454740.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/454740.shtml
英文地址,請注明出處:http://en.pswp.cn/news/454740.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

php 循環 顯示 圖片,thinkphp 循環顯示圖片問題!!!~~~~

該樓層疑似違規已被系統折疊 隱藏此樓查看此樓class CatController extends Controller {public function cat(){$goodsModel D(Admin/goods);$goodslist $goodsModel->field(goods_id,goods_name,shop_price,goods_img,market_price)->where(cat_id)->select();$th…

python flask 基礎入門

1. Flask 中的Hello World! 在使用pycharm創建一個Flask項目后,將會默認創建一個flask的app,這里來講下每行代碼表示的意義,代碼入下 from flask import Flask    # 導入flask模塊 如果沒有這個模塊需要使用pip install flask 進行安裝…

[C/C++]各種面試題

各種面試題 *程序的內存分配 一個由c/C編譯的程序占用的內存分為以下幾個部分 1、棧區(stack)— 由編譯器自動分配釋放 ,存放函數的參數值,局部變量的值等。其操作方式類似于數據結構中的棧。 2、堆區(heap&#xf…

linux 命令 which whereis locate find

0、概述 * which:在PATH變量指定的路徑中,搜索與指定名字匹配的系統命令的位置,并且返回第一個搜索結果。 * whereis:搜索與指定名字匹配的二進制文件、源文件和幫助手冊文件所在的路徑。二進制文件(參數-b&…

python 轉 exe -- py2exe庫實錄

本文基于windows 7 python 3.4 把python程序打包成exe,比較好用的庫是py2exe 其操作步驟是: --> 編寫python程序 --> 再額外編寫一個導入了py2exe的python腳本(不妨如:setup.py)存在同一目錄下 --> 運行這個腳本,打包生成的exe文件…

python網絡爬蟲面試題,搞定這套Python爬蟲面試題(面試會so easy)

搞定這套Python爬蟲面試題(面試會so easy)來源:中文源碼網 瀏覽: 次 日期:2019年11月5日【下載文檔: 搞定這套Python爬蟲面試題(面試會so easy).txt 】(友情提示:右鍵點上行txt文檔名->目標另存為)搞定這套Python爬蟲面試題(面試會…

fastjson與spring mvc整合的配置

fastjson 是阿里巴巴開發的開源json解析組件&#xff0c;方便于通過java來生成和解析json格式的字符串和對象。 fastjson可以對Spring的返回數據進行json轉換&#xff08;SpringMVC的ResponseBody注釋&#xff09; 以下附上與spring mvc整合的xml配置&#xff1a; <mvc:anno…

Python 框架 之 Scrapy 爬蟲(一)

在編寫爬蟲時&#xff0c;性能的消耗主要在IO請求中&#xff0c;當單進程單線程模式下請求URL時必然會引起等待&#xff0c;從而使得請求整體變慢。 1、同步執行 import requestsdef fetch_async(url):response requests.get(url)return responseurl_list [http://www.gith…

編程新手導論(轉載)

第二部分 導論&#xff0c;這一部分主要是關于編程的導論&#xff0c; (要懂得一點思想具備一點常識)《設計&#xff0c;編碼&#xff0c;&#xff0c;與軟工》&#xff08;編程與思想&#xff09;這一章解釋了三種思想&#xff0c;原語&#xff0c;抽象&#xff0c;組合&#…

如何讓電腦成為看圖說話的高手?計算機視覺頂會ICCV論文解讀

ICCV&#xff0c;被譽為計算機視覺領域三大頂級會議之一。作為計算機視覺領域最高級別的會議之一&#xff0c;其論文集代表了計算機視覺領域最新的發展方向和水平。阿里巴巴在今年的大會上有多篇論文入選&#xff0c;本篇所解讀的論文是阿里iDST與多家機構合作的入選論文之一&a…

canvas繪制線條1像素的問題

http://jo2.org/html5-canvas%E7%94%BB%E5%9B%BE3%EF%BC%9A1px%E7%BA%BF%E6%9D%A1%E6%A8%A1%E7%B3%8A%E9%97%AE%E9%A2%98/轉載于:https://www.cnblogs.com/XIE7654/p/7493315.html

php汽車找車位,遭遇到車多車位少 教你如何快速找到停車位

[摘要]車主們大多時間會穿梭在市區&#xff0c;到了目的地后那就先找停車位&#xff0c;現在市區寸土寸金&#xff0c;一個停車位面積要占幾平米呢&#xff0c;所以停車位基本是不夠用的。下面和大家聊聊怎么找合適的停車位。車主們大多時間會穿梭在市區&#xff0c;去商場購物…

Python 框架 之 Scrapy 爬蟲(二)

Scrapy是一個為了爬取網站數據&#xff0c;提取結構性數據而編寫的應用框架。 其可以應用在數據挖掘&#xff0c;信息處理或存儲歷史數據等一系列的程序中。其最初是為了頁面抓取 (更確切來說, 網絡抓取)所設計的&#xff0c; 也可以應用在獲取API所返回的數據(例如 Amazon Ass…

十六進制透明度參照表

00%FF&#xff08;不透明&#xff09; 5%F2 10%E5 15%D8 20%CC 25%BF 30%B2 35%A5 40%99 45%8c 50%7F 55%72 60%66 65%59 70%4c 75%3F 80%33 85%21 90%19 95%0c 100%00&#xff08;全透明&#xff09;轉載于:http…

lamp和php,[LAMP]Apache和PHP的結合

在LAMP架構中&#xff0c;Apache通過PHP模塊與Mysql建立連接&#xff0c;讀寫數據。那么配置Apache和PHP結合的步驟是怎么操作的呢&#xff1f;1、修改http.conf文件[rootjuispan ~]# cat /usr/local/apache2.4/conf/httpd.conf......#ServerName......AllowOverride noneRequi…

Day-5: Python高級特性

python的理念是&#xff1a;簡單、優雅。所以&#xff0c;在Python中集成了許多經常要使用的高級特性&#xff0c;以此來簡化代碼。 切片&#xff1a;對于一個list或者tuple&#xff0c;取其中一段的元素&#xff0c;稱為切片&#xff08;Slice&#xff09;。 L[start:end]表示…

前端之 XMLHttpRequest

XMLHttpRequest 和AJAX的愛恨情仇 AJAX 是 asynchronous javascript and XML 的簡寫&#xff0c;中文翻譯是異步的 javascript 和 XML&#xff0c;這一技術能夠向服務器請求額外的數據而無須卸載頁面&#xff0c;會帶來更好的用戶體驗。雖然名字中包含 XML &#xff0c;但 AJAX…

makefile——小試牛刀

//a.h,包含頭文件stdio.h,并且定義一個函數print #include<stdio.h> void print();//b.c&#xff0c;包含頭文件a.h&#xff0c;然后就可以寫print函數的內容了 #include"a.h" void print(){ printf("who are you\n"); }//c.c&#xff0c;包含頭文件…

云電腦是什么_云電腦和我們現在平時用的電腦有什么區別?

&#x1f340;溫馨提示&#x1f340;公眾號推送改版&#xff0c;為了不讓您錯過【掌中IT發燒友圈】每天的精彩推送&#xff0c;切記將本號設置星標哦&#xff01;~01云電腦&#xff0c;是5G云服務時代的電腦新概念&#xff0c;是電腦的新的一種形態。從具體操作使用上來講&…

PHP如何用while實現循環,PHP 循環 -

PHP 循環 - While 循環循環執行代碼塊指定的次數&#xff0c;或者當指定的條件為真時循環執行代碼塊。PHP 循環在您編寫代碼時&#xff0c;您經常需要讓相同的代碼塊一次又一次地重復運行。我們可以在代碼中使用循環語句來完成這個任務。在 PHP 中&#xff0c;提供了下列循環語…