AlphaGo 代碼開源了,很快你也可以挑戰它了

愛範兒 於 10/12/2016 發表 收藏文章

如果你對 AlphaGo 感興趣,也想自己動手試試,那麼下面是個好消息:根據 Engadget 的報道,Google 宣佈將 DeepMind 源代碼開源,上傳到 Github 上。Google 希望以此增加 AI 能力的開放性,讓更多開發者參與 AI 研究,觀察其他開發者是否能夠挑戰並打破 DeepMind 現在的紀錄。


(圖片來自 DeepMind 官網

實際上,AlphaGo 如今的水平已經幾乎打遍天下無敵手了。

昨天,2016 年三星杯世界圍棋大賽決賽中,中國棋手柯潔總比分 2:1 逆轉衞冕。賽後,據新華社採訪,柯潔坦言自己“現在的狀態還不能打敗‘AlphaGo’,今後需要更加努力。”


AlphaGo 的戰績確實足夠耀眼,讓這位史上最年輕的三星杯冠軍不想直纓其鋒芒:

  • 2015 年 10 月,它成為第一個無需讓子,即可在 19 路棋盤上擊敗圍棋職業棋士的電腦圍棋程序;
  • 2016 年 3 月,它以 4:1 的比分擊敗頂尖職業棋手李世乭,成為第一個不借助讓子即可擊敗圍棋職業九段棋士的電腦圍棋程序;
  • 2016 年 7 月 18 日,根據積分,Go Ratings 網站將 AlphaGo 列為世界圍棋排名第一,至此,人工狹窄智能又攻下了一片領地。

近 20 年的發展,圍棋人工智能從傳統人工智能方法,如使用暴力搜索法(窮舉法)、Alpha-beta 剪枝(評估後一個策略是否比前一個策略差,差則停止計算該策略後續發展)等,進化到使用蒙地卡羅樹狀搜索。蒙地卡羅樹狀搜索分為三部分:
  1. 走棋網絡:給定當前局面,預測/採樣下一步的走棋
  2. 快速走子:適當犧牲走棋質量的條件下,速度提升 1000 倍
  3. 估值網絡:給定當前局面,估計是白勝還是黑勝

這樣,既可以結合樹狀圖的長遠推斷,又可以像人類大腦自發學習進行訓練。


通過學習超過 1 億盤機器棋局和 80 萬人類棋局,單機版 AlphaGo 已經能將已有的圍棋人工智能甩在身後,而分佈式版本的 AlphaGo 則更是在對戰其他圍棋人工智能的 500 場比賽中獲得全勝。

除了實力驚人的 AlphaGo,Elon Musk 的 OpenAI 旗下電腦訓練場 “Universe” 也開放成為開源資源。


當然,雖然談及開源,兩家公司都表示希望一直保持 AI 代碼的開放性,但實際上,這也是一個略帶無奈的舉措。正如 Engadget 對此的評價,兩家公司發展至今,最稀缺的加速推進人工智能開發的東西就是海量數據,這也是為什麼兩個公司會選擇開源了這部分的代碼。


資料來源:愛範兒(ifanr)

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→