圖片來源:Unsplash
記者 | 佘曉晨
編輯 |
1
四足機器人也稱機器狗,是一種模仿狗的體型的機器人。最近幾年,隨著機器人技術的發(fā)展,機器狗的應用已經十分常見,但想讓它們和現實中的狗一樣跑步仍非易事。
盡管如今的機器人已經非常聰明,但比起人造的機器人,真正的動物的能力還是高得多——機器狗很難模仿真正的狗完成跑步這樣的敏捷動作。
但谷歌AI研究團隊最近研究出了一個更為簡單的方法,讓機器狗擁有自己跑步的能力。
近日,谷歌AI和加州大學伯克利分校合作進行了一項科研項目,研究目標是找到一種自動且高效的方法,將一只狗的敏捷行為(比如輕輕小跑或者旋轉)復制到四足機器人身上。
實際上,這并不是科學家第一次研究怎么讓機器人自動做出動物行為。但此項目的研究人員在博客文章中指出,那些已有的培訓過程通?!靶枰罅康膶<铱捶?,且往往包含大量冗長的獎勵調整機制,從而能夠得到預期的機器人技能?!?/p>
而這種方法并不能很好地適應機器人的具體情況,在這一過程中也必須要進行手動的調整,使得機器人更接近真狗的動作。即使是一個極度仿真的四足機器人,真狗的動作也不一定是機器人能夠適應的,因此機器人經常會出現跌倒、被鎖定等多種失敗的情況。
谷歌AI的這個項目則在正常程序中添加了一些可控的混亂因素,從而解決上述問題。這個方法的第一步是捕獲真狗的動作,同時仔細定位真狗的腳、關節(jié)等關鍵點。接著,虛擬版本的機器人(也就是模擬機器人)會嘗試自動模仿狗的運動,不斷學習這些動作。
這一模型的核心是強化學習方法,也就是通過獎勵、激勵機制完成目標的一種訓練技術。參照動作生成之后,強化學習算法將通過這些參照動作訓練框架策略,在模擬環(huán)境中把它們復制出來。
圖片來源:公開論文
到這一步為止都還算順利,但當我們使用模擬結果來控制現實的機器狗時,問題就出現了:現實世界并不是具有理想摩擦規(guī)則的二維平面,這意味著未經修正的、基于模擬環(huán)境的動作會直接引導機器人進入地面。
為了防止這種情況發(fā)生,研究人員在模擬過程使用的物理參數中引入了隨機性元素,加入一些動作變量,比如使虛擬機器人的重量更大、與地面的摩擦更大等。
由此,根據模型學習走路的機器人必須考慮各種細微的差異,以及這些差異產生的復雜性,包括如何抵消它們。
學會適應隨機性使這些行走動作在現實世界中更加穩(wěn)定,從而讓機器狗模仿狗自由奔跑,甚至更復雜的動作,例如轉彎和旋轉。最關鍵的是,完成這些動作無需人工干預,只需要一些額外的虛擬訓練。
此外,研究中使用的機器狗是一家初創(chuàng)公司宇樹科技的“萊卡狗”( Laikago)。宇樹科技是一個成立于2016年的中國機器狗公司,曾被媒體稱為“中國的波士頓動力”。2019年8月,宇樹科技在其官網發(fā)布了 “萊卡狗”的視頻,視頻顯示,8輛“萊卡狗”一起拖動了一輛載人面包車。
責任編輯: