波士頓動力有對手了:不怕摔倒的機器狗,怎麼踹都能站起來

愛範兒 於 24/01/2019 發表 收藏文章


波士頓動力的機器狗,平衡感的確很強。

可再強也有摔倒的時候。而且,它們倒下之後需要人類扶起來。


這時候,就要隆重介紹 ANYmal 機器狗。

它摔倒之後只要蹬一蹬腿,就能重新站起來了:


但這並不表示它的平衡能力弱。

畢竟,這隻狗對刁鑽的地形毫不畏懼:


不論是踩着浪花,還是登高遠眺,都如履平地;

下雪的時候也能走樓梯。


重要的是,ANYmal 幾乎不依賴人類灌輸的知識。

初初來到這個世界,它不會站立不會走路:成熟的生存能力,是靠強化學習算法一點一點解鎖的。

(相比之下,MIT 科技評論説,波士頓動力機器人的動作,大多是人類手動編寫的。)

ANYmal 的大腦,是蘇黎世聯邦理工學院 (ETH Zurich) 和英特爾一同開發的,還登上了最新一期的 Science Robotics。

夢裏可以,現實就可以

就像剛才提到的那樣,機器狗的每一個動作,都不是人工寫的:

它是在模擬器裏,用強化學習算法學會的。

為什麼要用模擬器?


在模擬器裏,2,000 多隻機器狗 (智能體) 可以一起學走路,一起應對各種刁難。

這樣一來,可以輕而易舉地獲得大量的數據。
而有了強化學習算法,智能體可以在千萬次試錯中,找到技巧:

站起來


訓練開始的時候,它像一隻出生不久的小狗,可能是四肢的力量還弱,可能是還不懂得怎樣用力。
經過 1,500 代的訓練,運動策略已成熟穩健,機器狗可以從側卧的狀態毫不猶豫地正起身來。

它知道自己撲街的姿勢是怎樣的,就知道該用怎樣的動作,讓自己站起來:


更重要的是,模擬器裏訓練好的運動策略,不用做任何修改,就可以直接交給現實中的機器狗。

不論跌倒的時候,腿是如何被壓在身下,最終都能順利地站起來。

平衡感

當然,摔倒之後再爬起來,並不是上策。

而保持平衡,避免跌倒,也是機器狗的一項關鍵技能。畢竟按照慣例,有好事者會在一旁踢腿:


不用怕,這也是在模擬器裏學過的。

速度速度

另外,強化學習算法還可以針對不同的奔跑速度,來訓練策略。

訓練之下,機器狗的秒速已經達到 1.5 米,比沒用強化學習的時候快了 25%


而單單跑得快,也是不夠的。前方的路並不平坦:

障礙物

作為一隻勇敢的機器狗,也該不懼路途中的任何障礙。

比如,越過障礙的同時,不要把自己摔下去:


比如,就算沒有辦法助跑,也要跨過 “大型” 障礙:


畢竟,ANYmal 一向是在危險的環境裏接受訓練的。

不管火災還是水災,人類越難進入的空間,越是它工作的地方。


不只是對手

或許,ANYmal 是波士頓動力當下最有力的對手了。

但這場比賽的節奏,也不一定要多麼緊張。

機器人頂會 IROS 2018 的現場,ANYmal 與波士頓動力的 SpotMini 相遇了。


兩隻身材相仿的機器狗,與其説向對方宣戰,不如説見面便是一副恩愛的樣子。

還有一隻嬌小的萊卡狗,在一旁靜靜地吃着狗糧。

你看,ANYmal 俯下身去,SpotMini 輕輕地吻了它的額頭:


也許,在嚴酷的訓練之外,加入清新自然的社交活動,能讓機器狗更有活力地投入下一階段的任務吧。

本文來自微信公眾號量子位(ID:QbitAI),作者為平衡慄,原文鏈接請點擊查看,愛範兒經授權發佈,文章為作者觀點,不代表愛範兒立場。


資料來源:愛範兒(ifanr)

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→