玩德州撲克的“AlphaGo”來了,擊敗它可以拿走 20 萬美元

愛範兒 於 11/01/2017 發表 收藏文章

從 1 月 11 日開始,5 名頂尖德州撲克選手將在匹茲堡的賭場展開爭奪,不過,其中一名選手卻不是人類。

在這項名為“人腦 VS. 人工智能”的對決中,四名職業選手 Jason Lee、Dong Kim、Daniel McAulay 和 Jimmy Chou 將分別與卡內基梅隆大學開發的 “Libratus”人工智能系統進行單挑。賽程為期 20 天,總共將對戰 12 萬手牌,獎金為 20 萬美元。


(Dong Kim 曾在 2015 年與卡內基梅隆大學的 Claudico 對戰過,圖片來自:CMU

AI 與人類對決不是什麼新鮮事,但是,重點來了,本次的比拼項目的是德州撲克。

我們在下象棋或圍棋的時候,能夠看得到彼此手中的棋子、排兵佈陣等信息,這種被稱為“完整信息博弈”。而德州撲克則不同,每個玩家手中的底牌只有自己知曉,其他玩家是看不到的,所以是“非完整信息”(Imperfect information)。


(圖片來自:PopularMechanics

鑑於德州撲克獨特的規則,AI 想要主宰比賽並沒有那麼容易。總之,與棋類遊戲相比,德州撲克對於 AI 來説更具有挑戰性,也是近來十分流行的人工智能測試項目。

卡內基梅隆大學的 Libratus 採用的是一種名為“納什均衡”的對戰策略,在這一策略裏,只要其他玩家的策略保持不變,單一玩家就無法通過變換策略獲益。

Libratus 要做的就是識別沒有希望的策略,從而更快地找到納什均衡點。經過反覆的訓練後,Libratus 已經能夠忽略那些糟糕的路徑了。

不過,Libratus 並非唯一一個會玩德州撲克的 AI,就在就在卡內基梅隆大學宣佈 Libratus 出戰的幾天前,加拿大阿爾伯特大學搶先發表了關於撲克 AI 的論文,表示他們的 DeepStack 是世界上第一個在“一對一無限注德州撲克”上擊敗了職業撲克玩家的計算機程序。


上週,著名的論文網站 Arxiv 出現一篇題為《 DeepStack:無限下注撲克裏的專家級人工智能》(DeepStack: Expert-Level Artificial Intelligence in No-Limit Poker)的論文,作者是來自加拿大 Alberta 大學、捷克 Charles 大學、布拉格捷克理工大學的研究人員。

該論文顯示,DeepStack 在與 33 位人類選手進行的 4.4 萬手較量中,平均勝率為 492 mbb/g,一般認為人類玩家這一數據達到 50 mbb/g 就具有較大的贏面,而 750mbb/g 就是對手每局都棄牌的節奏了。

值得一提的是,DeepStack 玩的是無限下注類的德州撲克,玩法比有限下注要複雜得多。

然而,DeepStack 雖然有先發優勢,但明顯引發的關注度不如 Libratus。

卡內基梅隆大學模仿了 AlphaGo 的套路,賭場、機器與頂尖人類高手對決、20 萬美元獎金,這顯然比 DeepStack 團隊一篇論文更能吸引眼球。


(圖片來自:PopularMechanics

與此同時,一些撲克專家也對DeepStack 提出了質疑,認為與其對戰的玩家中沒有頂級選手,而 Libratus 要面對的卻是全球排名靠前的高手。

至於 20 萬美元的獎金最終將被哪方收入囊中,我們還得等上差不多三週的時間。

題圖來自:Geek.com


資料來源:愛範兒(ifanr)

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→