當前位置:
首頁 > 知識 > 下棋下不過AI,打撲克也不行

下棋下不過AI,打撲克也不行

下棋下不過AI,打撲克也不行


近日,兩個人工智慧程序成功證明了自己,機器也可以懂得什麼時候跟牌什麼時候棄牌。它們首次在十分普及的紙牌遊戲——德州撲克——中戰勝了人類的專業玩家。本周,其中一個AI的幕後團隊,深度堆棧(DeepStack),向我們透露一些成功背後的秘密——這可能是AI從航空安全系統走向商務談判的衝鋒號。


各種博弈遊戲中AI的統治地位由來已久,比如象棋,比如去年讓人類僥倖贏了一盤的阿爾法狗,但在撲克領域AI一直表現的挺糟糕。深度堆棧的研究人員將新的演算法和深度機器學習結合起來,終於打破了他們連敗的局面。深度學習是計算機科學中一種模仿人類大腦的方法,使得機器可以自學。

"這是一種尺度可調的處理複雜信息的方法,可以在短時間內做出優化的決定,甚至比人類還好。"Murray Campbell說道,他是紐約IBM公司的研究員,曾經最好的象棋AI,深藍,的創造人之一。


象棋和圍棋有一個重要的共同點,也是AI的首要優勢:他們都是完美信息博弈。這意味著雙方都完全了解對方在做什麼——這在設計AI時有巨大的幫助。德州撲克中的跟牌卻不相同,此時玩家要面對兩張具有隨機性的未知底牌。每輪公共牌後玩家要做出適當的行動,押注、跟注或棄牌。因為遊戲就本身的不確定性以及初始底牌未知,不像象棋,可以從當前盤面以及對手所有可能的步驟中推算最優策略。玩德州撲克需要某種我們稱之為直覺的東西。


傳統博弈類AI原理可簡述為儘可能深地計算所有可能的步驟並利用演算法將過去已有的對戰數據排序分析。缺點在於,為了壓縮可用數據,有時會把一些無效策略組合起來,加拿大Alberta大學的計算機教授Michael Bowling說到。


他們團隊的AI規避了只計算前幾步而不去計算全局即輕易判斷的方法。程序在獲得新的信息之後會不斷調整演算法。當AI需要比對手先行動,而此時沒有新的信息來做判斷,深度學習就發揮作用了。

神經網路,是一種把深度學習獲取的知識加以歸納的系統。通過訓練其在博弈中的行為可以幫助限定演算法需要考慮的潛在情況。這使得AI的反應可以更為迅速而準確,Bowling說到。為了訓練深度堆棧的神經網路,研究人員讓其解了超過一千萬局隨機生成的牌局。


去年研究人員為測試深度堆棧,安排它與國際撲克聯合會選出的33名專業撲克玩家對戰。在4周的時間裡,程序共演算了44852局一對一無限注德州撲克,這是一種雙玩家無下註上限的版本。通過公式估算其中非策略、偶然獲勝的比例後,最終深度堆棧的勝率為486mbb每局,1mbb定義是每局獲勝需要押注的千分之一。這是專業選手一般認為很大的利潤率的10倍,該團隊的結果已在science上報道。


這項結果呼應了幾周前大獲成功的Libratus,一款由Carnegie Mellon 大學設計的撲克AI。經過長達20天,共約120000手牌的激戰,AI戰勝了4位人類頂尖的德州撲克玩家。兩個團隊都聲稱其AI在德州撲克的優勢已經在統計上確認了。不同之處在於Libratus缺少深度學習的過程而需要更多的計算資源,它的演算法每次都對遊戲進行完整的運算。而深度堆棧在筆記本電腦上就可以跑,Bowling說。


雖然目前還不知道這兩個AI誰是德州撲克王中王——暫時也沒有安排兩個對戰的計劃——雙方團隊都在把系統加以改造以適用於更加複雜的實際問題中,像是安保和談判。Bowling正試圖將其應用在公共運輸信譽系統中優化查票機制。


研究者還很關注該技術在商業上的影響。由於其可以在非完美信息下作決斷, 可以幫助房子的買家在知道所有競價前預測競標價格,制定抵押計劃。其它的完美信息系統,例如阿爾法狗就沒辦法做到這一點,因為缺乏對其他競標數量和大小等的限制條件。

當然,距離深度堆棧能夠完全模仿複雜的人類決策還有很多年,Bowling說。機器還要學會在不知道遊戲規則的情況下如何做決策,好比如果AI沒有提前進行神經網路的學習。


Campbell同意這一點,打撲克是比下棋複雜不少了,但要能處理一團亂麻的現實世界還要繼續努力。


[dingding via sciencemag]


給這篇稿打賞,讓譯者更有動力

支付寶打賞 [x]


您的大名:
打賞金額:



喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 煎蛋 的精彩文章:

為什麼大熊貓是黑白的
抱歉:所謂迷你寵物豬,都是騙人的
沒品小視頻:聊著聊著我的三觀就……
發霉啦:今天,我去做美甲
NASA發布GIF:一顆超新星爆發著一億倍太陽的能量

TAG:煎蛋 |

您可能感興趣

人生在他筆下不過是一次幻覺
來自動物的「熱情」,人家在那好好的,你要過去招惹,嚇唬你一下不過分吧?
苦難有如烏雲,遠望墨黑身臨其下不過是灰色
象棋全國冠軍呂欽、胡榮華都下不過一個「賣燒雞的」?