機器人能夠對物理定律擁有直覺理解,聽起來可能像艾薩克·阿西莫夫的小說情節(jié)。不過,谷歌機器人部門的科學家卻透露,他們已經打造出這樣的機器人。目前,即使是最有能力的機器人,也很難完成投擲、滑動、旋轉、擺動、接球和其他運動技能,但是這些科學家表示,他們的研究工作將為未來的機器人系統(tǒng)奠定基礎。
谷歌學生研究員Andy Zeng在一篇博客文章中寫道:“盡管機器人在高效抓取物體、視覺自適應甚至從現(xiàn)實世界經驗中進行學習等方面已經取得了相當大的進步,但機器人操作仍然需要仔細考慮如何拾取、處理和放置各種物體——尤其是在非結構化的環(huán)境中。但是,機器人能不能學會有利地使用動力學,培養(yǎng)物理‘直覺’,從而讓它們更有效地完成任務?”
為了回答這個問題,Zeng和同事們與普林斯頓、哥倫比亞和麻省理工學院的研究人員合作,開發(fā)了一種他們稱之為TossingBot的拾取機器人,該機器人可以學會抓取物體并將其扔進“自然范圍”之外的盒子里。它不僅達到了之前最先進模型的兩倍速度,而且實現(xiàn)了兩倍的有效放置范圍,并可以通過自我監(jiān)督進行改善。
要想實現(xiàn)具有可預測性的投擲并不容易,即使對人類來說也是如此。抓力、姿勢、質量、空氣阻力、摩擦力、空氣動力學和無數(shù)其他變量都會影響物體的軌跡。通過反復試驗來模擬射彈物理是有可能的,但Zeng指出,這將耗費大量的計算資源,需要大量的時間,而且不會生成一般普遍的規(guī)律。
相反,TossingBot使用射彈彈道模型來估計物體到達目標位置所需的速度,而且它使用端到端的神經網絡——以生物神經元為模型的數(shù)學函數(shù)層——根據來自頭頂攝像機的視覺和深度數(shù)據進行訓練,以此來預測基于估計值的調整度。Zeng說,這種混合方法使系統(tǒng)能夠達到85%的投擲準確度。
教會TossingBot抓取物體有點棘手。首先,它需要反復嘗試“不好的”抓取,直到找到更好的方法,同時通過以前所未有的速度隨機投擲物體來提高投擲能力。經過大約14小時、1萬次抓取和投擲嘗試后,TossingBot可以在大約87%的時間里牢牢抓取放置在雜亂堆積物品中的物體。
或許更令人印象深刻的是,經過一兩個小時的訓練,TossingBot可以適應從未見過的地點和物品,比如假水果、裝飾物品和辦公用品。Zeng說:“TossingBot很可能學會更多地依賴幾何線索(如形狀)來學習抓取和投擲。這些新出現(xiàn)的特性都是自我學習,除了任務級的抓取和投擲之外,沒有任何明確的監(jiān)督。然而,它們似乎足以使系統(tǒng)區(qū)分對象類別(如乒乓球和記號筆)。”
研究人員承認,由于TossingBot使用嚴格的視覺數(shù)據作為輸入,如果對易碎物體進行測試,可能會妨礙它在測試中對新物體做出反應的能力。但是他們也表示,結合物理學和深度學習,將會是未來一個有希望的方向。
關鍵詞: 谷歌拾取機器人