彈跳機器人 桌游_MIT機器人輕松搞定桌游疊疊樂:你能玩過它算我輸 |《科學》子刊...

乾明 發自 凹非寺 量子位 報道 | 公眾號 QbitAI

江湖上,一直流傳著一種疊疊樂的試煉。

規則很簡單,從下方的積木中,抽一根往上搭。

你能往上搭幾層?

對MIT團隊研發的機器人來說,玩這個游戲基本上不費吹灰之力。

而且,它只需要訓練大約300次就行了,一般的機器人少說也要訓練上萬次。

研究團隊說,這個機器人并不醉心疊疊樂。

接下來要進軍工業界,組裝手機等消費產品等等。

疊疊樂有什么難的?

從上面的動圖中可以看出,疊疊樂是一個牽一發而動全身的游戲。

與國際象棋、圍棋等純粹的認知任務或者游戲不同,機器人需要掌握物理技能,比如探測、推、拉、放置、對齊積木等等。

這就要求它必須進行交互的感知和操作,這種情況,是很難在計算機上模擬出來的。

機器人必須要在接觸積木塔的同時,來學習如何移動積木。

MIT的研究團隊說,關鍵的挑戰在于,如何利用實際上的嘗試,從相對較少的實驗中去學習。

他們給出的方法是——

聚類學習,視覺觸覺兩開花

簡單來說,就是搜集視覺觸覺數據,然后對數據聚類,建立相應的模型。

為了搜集數據,研究團隊定制了一個行業標準的 ABB IRB 120機械臂。然后在機器人能夠觸及的范圍內搭建了一個積木塔,開始第一段的訓練期。

機械臂的配件有3個,一個是用來操作積木軟齒夾鉗,也可以反饋觸感;一個是用來控制操作積木的力度的力感應腕帶;還有一個外部攝像頭,用來收集視覺圖像。

想讓機器人學會玩疊疊樂,傳統的做法是收集積木、機器人、積木塔之間可能發生的一切。

這顯然會帶來大量的數據,在成千上萬次的嘗試中尋找可行的模式,耗費的計算資源可想而知。

MIT研究團隊的做法是,模仿人類玩這個游戲的方式。

在訓練期中,機器人會隨機選擇一個積木,以及推動的積木的位置。 然后用較小的力道,試圖將積木推出塔外。

對于每一次嘗試,計算設備都會記錄相關的視覺、觸覺、力度等指標,并標注是否成功。

按照這種方法,機器人只訓練大約300次,就對這些測量結果進行聚類分組。

比如,一組數據可能代表機器人在難以移動的積木上的嘗試,而另一組數據則代表一個比較容易移動的積木上的嘗試。

對于每個數據集群,研究團隊都給機器人開發了一個簡單的模型,根據當前的視覺和觸覺數據來預測移動一個積木的行為。

他們說,讓機器人建立聚類,然后學習每個聚類的模型,而不是學習一個能完全捕捉可能發生的一切的模型,能夠極大地提高了機器人學習游戲的效率。

結合這些模型,機器人還會實時地“學習”,當機器人小心地推動一個積木塊時,計算機會通過它攝像頭和鉗子接收視覺和觸覺反饋,并將這些反饋結果與機器人先前做出的動作進行比較。

然后考慮這個動作的后果,即是否能夠在特定的結構下,用特定的力度,把特定的積木塊抽出來,放到上面,并確保積木塔不倒。

最后,這項研究的論文,已于近日刊發在了Science Robotics上。

作者為:Nima Fazeli、Miquel Oller、Jiajun Wu、Zheng Wu和Joshua Tenenbaum。

如果你感興趣,請收好傳送門:

See, feel, act: Hierarchical learning for complex manipulation skills with multisensory fusionhttp://robotics.sciencemag.org/content/4/26/eaav3123

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/533464.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/533464.shtml
英文地址,請注明出處:http://en.pswp.cn/news/533464.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

華為鴻蒙無人駕駛,特斯拉最大的對手竟是華為?Hicar+鴻蒙OS無人駕駛技術不再一家獨大!...

原標題:特斯拉最大的對手竟是華為?Hicar鴻蒙OS無人駕駛技術不再一家獨大!短短幾個月的時間,特斯拉的市值翻了近4倍,對于一個超級企業來說一切都顯得那么不可思議,如果把它單純的看成一家車企,恐…

new_picview_一款漂亮的圖片查看器PictureViewer

前段時間寫了一款查看妹子圖片的客戶端宅男福利妹子客戶端SuperGank,于是后來就把其中的一個圖片查看的功能封裝成了一個library,使用簡單,可以進行多項設置。先來看一眼效果圖吧!下面來看看如何使用它:首先把圖片url的…

鴻蒙系統會不會影響游戲,令人擔心,鴻蒙系統會不會讓人失望?未來難說

如今,一直被炒的沸沸揚揚的鴻蒙系統,終于在2019年8月9日發布了,次日,也就是8月10日,榮耀的智慧屏又帶著鴻蒙系統出現了一次,榮耀智慧屏也成為了首次搭載鴻蒙系統的終端,見證了中國操作系統的歷史…

buck電路上下管_推薦 | 學好電路設計與仿真?你不能錯過這兩本書籍 ~

網 友小編,有沒有 Saber 相關書籍可以推薦一下?還有,Saber 軟件下載那個版本比較好?當然有啦!小 編《Saber 電路仿真及開關電源設計》柯福波 等編著本書以 Saber 開關電源為基礎,以具體工程電路為范例&am…

html5畫電池狀態,HTML5的一個顯示電池狀態的API簡介

這篇文章主要介紹了HTML5的一個顯示電池狀態的API簡介,由Mozilla設計,具體的設備和瀏覽器支持情況還要通過檢測才能確定,需要的朋友可以參考下移動設備的份額在網絡流量中在大量增長,其所貢獻的網絡流量非常龐大,以至于為了移動設備,我們單獨…

redux異步action_react-redux--異步Action

上兩篇文章敘述的都是同步操作,每當 dispatch action 時,state 會被立即更新。但是實際應用中,我們有很多操作執行后,過一段時間,才會得到結果。那么怎么處理這種情況呢?先熟悉一個概念中間件本質就是一個通…

怎么批量修改html文件后綴,如何批量修改文件后綴名

我們都知道電腦文件都有一個格式,比如JPG、MP3等等格式,每個格式都代表不一樣文件類型,那么我們該如何批量更改文件類型的后綴呢?比如把JPG更改為MP3,只要在電腦里設置不隱藏文件擴展名,然后建立統一的文件夾&#xf…

python 怎么調用 矩陣 第幾行_第58集 python機器學習:混淆矩陣精度指標

混淆矩陣的精度計算公式為:精度(TPTN)/(TPTNFPFN),也就是說,精度就是指正確的預測數目除以所有樣本的數量。準確率、召回率與f-分數:總結混淆矩陣還有幾種方法,其中最常見的就是準確率和召回率。準確率度量的是被預測為…

android seekbar閃退,android seekbar 踩坑之路

最近項目中有用到seekbar,之前對這東西不太了解,趁機來踩坑。seekbar樣式按我覺得Material 中的還不算難看了。但是美工給了自己的樣式,還是得改。主要有這2個屬性:android:thumb"drawable/thumb"android:progressDrawable"dr…

tensorflow分類的loss函數_tensorflow 分類損失函數使用小記

多分類損失函數label.shape:[batch_size]; pred.shape: [batch_size, num_classes]使用 tf.keras.losses.sparse_categorical_crossentropy(y_true, y_pred, from_logitsFalse, axis-1)- y_true 真實值, y_pred 預測值- from_logits,我的理解是,如果預測…

華為鴻蒙系統還沒發布嗎,華為沒有孤軍奮戰,合作伙伴“雪中送炭”,鴻蒙系統正式發布!...

6月2日晚上,期待許久的鴻蒙0S 2終于正式登場了,這意味著鴻蒙手機已經變成了面向市場的正式產品,這是華為邁出的一小步,卻是國產系統與安卓、iOS競爭的開始。在鴻蒙OS正式推出后,不少華為手機用戶已經收到了系統更新的推…

freemark循環map_java與freemarker遍歷map

一、java遍歷MAP/*** 1.把key放到一個集合里,遍歷key值同時根據key得到值 (推薦)*/Set set map.keySet();Iterator itset.iterator();while(it.hasNext()){String s (String) it.next();System.out.println(map.get(s));}/*** 2.把一個map對象放到放到entry里&#…

.net 開發 html框架,Asp.net的開發框架

Asp.net的開發首先要選擇開發框架,選擇怎樣框架要看看開發什么養的網站用的,選擇一個適合的開發框架能節約很多的時間。20個優秀的前端框架:1. Twitter BootStrap (Apache v2.0;響應式)時髦、直觀并且強大的前端框架,讓…

baseresponse響應類_內部類、響應類Response、序列化基類、反序列化、全局局部鉤子...

一、內部類1、概念:將類定義在一個類的內部,被定義的類就是內部類2、特點:內部類及內部類的所以名稱空間,可以直接被外部類訪問的3、 應用:通過內部類的名稱空間,給外部類額外拓展一些特殊的屬性(配置)&…

python模塊名限定_python?正則表達式?匹配??的使用?限定符?sys.re模塊

特殊字符:注意\b是匹配單詞而非字符串的開始和結束; \w不能匹配漢字限定符放在匹配符的后邊2 括號分組:(\d\d\d){2} #有括號匹配6位數字\d\d\d{2} #沒有括號匹配4位數字3 ?的使用4 sys.re模塊的常用函數表:查找、分隔、…

計算機不能進入桌面,電腦開機無法進入桌面,請高手解決。

該故障是Windows XP操作系統關機故障中最容易出現的故障。造成該故障的原因可能有以下幾方面原因:系統設置在添亂Windows XP默認情況下,當系統出現錯誤時會自動重新啟動,這樣當用戶關機時,如果關機過程中系統出現錯誤就會重新啟動…

太陽能板清洗機器人科沃斯_太陽能電池板清潔機器人

太陽能電池板清潔機器人銳寶RAYBOT,可以實現自動升降式地免水清掃,使常年暴露在太陽下的電池板能徹底擺脫灰塵和污垢。當放置在太陽能電池板上時,銳寶能夠自主行走、跨越最大3cm間隙并自動規劃路線。底部吸盤設計能使RAYBOT安全地吸附在最大安…

html jq 控制顯示密碼,js、jquery分別實現點擊密碼輸入框密碼顯示和隱藏

很多密覽始不次這得是覺磚怎可我滾腦選的方近器上碼框都有個眼睛標記,點擊能顯示密碼。原理就是點擊切換password為te要圈器是天的年編功小還久概據含直這請框結業未商屏頁屏隨會維氣大機域頁效實一應控高標近用功的xt等顯示主要知識點:onmousedown&…

maven依賴循環引用_maven循環引用的問題

多模塊的maven工程,有時候由于設計的不合理或者需求的變更。會導致模塊之間產生循環依賴,編譯的時候會報如下的錯誤:[INFO] Scanning for projects... [ERROR] The projects in the reactor contain a cyclic reference: Edge between .....重…