波士頓動力的機器狗,平衡感的確很強。
可再強也有摔倒的時候。而且,它們倒下之後需要人類扶起來。
這時候,就要隆重介紹 ANYmal 機器狗。
它摔倒之後只要蹬一蹬腿,就能重新站起來了:
但這並不表示它的平衡能力弱。
畢竟,這隻狗對刁鑽的地形毫不畏懼:
不論是踩着浪花,還是登高遠眺,都如履平地;
下雪的時候也能走樓梯。
重要的是,ANYmal 幾乎不依賴人類灌輸的知識。
初初來到這個世界,它不會站立不會走路:成熟的生存能力,是靠強化學習算法一點一點解鎖的。
(相比之下,MIT 科技評論説,波士頓動力機器人的動作,大多是人類手動編寫的。)
ANYmal 的大腦,是蘇黎世聯邦理工學院 (ETH Zurich) 和英特爾一同開發的,還登上了最新一期的 Science Robotics。
夢裏可以,現實就可以
就像剛才提到的那樣,機器狗的每一個動作,都不是人工寫的:
它是在模擬器裏,用強化學習算法學會的。
為什麼要用模擬器?
在模擬器裏,2,000 多隻機器狗 (智能體) 可以一起學走路,一起應對各種刁難。
這樣一來,可以輕而易舉地獲得大量的數據。
而有了強化學習算法,智能體可以在千萬次試錯中,找到技巧:
站起來
訓練開始的時候,它像一隻出生不久的小狗,可能是四肢的力量還弱,可能是還不懂得怎樣用力。
經過 1,500 代的訓練,運動策略已成熟穩健,機器狗可以從側卧的狀態毫不猶豫地正起身來。
它知道自己撲街的姿勢是怎樣的,就知道該用怎樣的動作,讓自己站起來:
更重要的是,模擬器裏訓練好的運動策略,不用做任何修改,就可以直接交給現實中的機器狗。
不論跌倒的時候,腿是如何被壓在身下,最終都能順利地站起來。
平衡感
當然,摔倒之後再爬起來,並不是上策。
而保持平衡,避免跌倒,也是機器狗的一項關鍵技能。畢竟按照慣例,有好事者會在一旁踢腿:
不用怕,這也是在模擬器裏學過的。
速度速度
另外,強化學習算法還可以針對不同的奔跑速度,來訓練策略。
訓練之下,機器狗的秒速已經達到 1.5 米,比沒用強化學習的時候快了 25%。
而單單跑得快,也是不夠的。前方的路並不平坦:
障礙物
作為一隻勇敢的機器狗,也該不懼路途中的任何障礙。
比如,越過障礙的同時,不要把自己摔下去:
比如,就算沒有辦法助跑,也要跨過 “大型” 障礙:
畢竟,ANYmal 一向是在危險的環境裏接受訓練的。
不管火災還是水災,人類越難進入的空間,越是它工作的地方。
不只是對手
或許,ANYmal 是波士頓動力當下最有力的對手了。
但這場比賽的節奏,也不一定要多麼緊張。
機器人頂會 IROS 2018 的現場,ANYmal 與波士頓動力的 SpotMini 相遇了。
兩隻身材相仿的機器狗,與其説向對方宣戰,不如説見面便是一副恩愛的樣子。
還有一隻嬌小的萊卡狗,在一旁靜靜地吃着狗糧。
你看,ANYmal 俯下身去,SpotMini 輕輕地吻了它的額頭:
也許,在嚴酷的訓練之外,加入清新自然的社交活動,能讓機器狗更有活力地投入下一階段的任務吧。
本文來自微信公眾號量子位(ID:QbitAI),作者為平衡慄,原文鏈接請點擊查看,愛範兒經授權發佈,文章為作者觀點,不代表愛範兒立場。
資料來源:愛範兒(ifanr)
請按此登錄後留言。未成為會員? 立即註冊