德州撲克人機大戰,AI 有着壓倒性優勢,局勢幾乎不可逆轉

雷鋒網 於 23/01/2017 發表 收藏文章

在德州撲克人機大戰中,四位職業牌手與 CMU 開發的人工智能系統 Libratus 進行了激烈對抗。

Libratus是卡耐基梅隆大學的托馬斯·桑德霍爾姆和諾姆·布朗(Noam Brown)開發的。他們以前開發的機器人 Claudico 在 2015 年的德州撲克比賽中沒能擊敗職業牌手。

此前雷鋒網(公眾號:雷鋒網)也曾報道過,“一對一無限注德州撲克”就是兩個人玩的賭博遊戲,因為事先會給每位玩家分發 2 張底牌,所以對方“底牌信息”你是不知道的,對於計算機來説,就是在處理一種“非完整信息博弈”。我們知道 AlphaGo 玩圍棋,對弈雙方的信息是完整的、對稱的,並沒有隱藏的信息。所以在德州撲克上AI取得了進步,是具有重要意義的。

比賽期間,前三輪比賽失利後,四位職業牌手在第四天和第六天的比賽中獲得勝利。Libratus 原本領先193000 美元,在第六輪比賽後 Libratus 僅領先 51000美 元。

在人類選手反擊迅猛之時,牌手之一詹森·萊斯便在一封電子郵件中寫道:

引用我們花了一段時間學習,以理解正在發生的事情。

然而,隨後 Libratus 的表現讓所有非常人吃驚:再次獲得關鍵性勝利。第 10 天結束時,Libratus 已經領先 677000 美元,而且局勢也似乎不可逆轉。

跟 AlphaGo 相似,Libratus 也可通過增強學習進行自我博弈和學習。

Libratus 的開發者之一托馬斯·桑德霍爾姆也説道:

引用我們不能詳細談論 Libratus 的技術,直到比賽結束為止。但是,我可以告訴大家,Libratus 的算法一直在超級計算機上運行,所以超級計算機每天都在輸出改進的策略。

今年 1 月底,Libratus 可能會在下一場比賽中再次擊敗人類。到目前為止,機器人還沒有在無限制德州撲克團體賽中擊敗過人類,但這一天也許不會太遠了。

人工智能撲克機器人的研發具有重大意義。首先,它是一種教導人工智能系統處理不完整信息的方式。諾姆·布朗指出“在現實世界中,所有的相關信息通常不像棋盤上的棋子那樣明顯。有些重要的信息會丟失或隱藏,人工智能需要能夠處理這樣的信息。”

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知



資料來源:雷鋒網
作者/編輯:亞峰

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→