史上首次!外媒:AI在多人撲克比賽中勝過人類
參考消息網7月13日報道外媒稱,美國《科學》周刊11日發表的一項研究顯示,由臉書公司和美國卡內基-梅隆大學共同研發的人工智慧(AI)系統「Pluribus」在六人制德州撲克比賽中擊敗了5名職業選手。
據埃菲社7月11日報道,這是當前唯一一個在多人比賽中表現勝過人類撲克選手的AI系統。在此之前,在撲克比賽中擊敗人類是少數AI未能完成的挑戰之一。
報道稱,對於AI系統而言,撲克具有諸如國際象棋等其他遊戲不具備的難點,那就是「信息不對稱」:由於桌面上的一些牌始終背面朝上,玩家只能了解遊戲進程的一部分。因此,想要獲勝就必須理解和猜測其他玩家的行為,這其中包括辨別對手什麼時候是在虛張聲勢以及自己通過虛張聲勢的做法欺騙對手。
在實驗中,該研究報告作者圖奧馬斯·桑德霍爾姆和諾姆·布朗採用「行動抽象」和「信息抽象」技術,減少AI在一局遊戲中需要考慮的行動。
據他們介紹,強化學習系統和新演算法的結合是機器能夠戰勝人類的關鍵。這款由他們與臉書共同研發的名為「Pluribus」的AI系統,在一次又一次與自身副本的對抗中學會了如何在六人制無限制德州撲克比賽中獲勝。
在與副本進行遊戲的過程中,該AI系統生成了一套既定策略,科學家們稱之為「行動計劃」。而在與真實的對手比賽時,Pluribus會通過尋找其他對於應對當局遊戲而言更有效的即時行動來改進這套既定策略。
事實上,Pluribus的演算法做出的一些反饋甚至讓它的開發者感到驚訝。大多數職業撲克選手會避免一種明顯不合邏輯的下注方式(在術語中被稱作「驢式下注」),其唯一的目的是擾亂在遊戲中居主導地位的玩家。然而,Pluribus會相對頻繁地使用這種下注方式。被它擊敗的職業選手之一達倫·伊萊亞斯說:「AI最強的地方在於它運用混合策略的能力。我們人類選手也想做同樣的事,但我們在執行上存在問題。以完全隨機的方式持續進行這種操作非常難。」
桑德霍爾姆指出,在此之前,在戰略思維方面超越人類的AI所取得的重大成就僅限於二人對決,但在如此複雜的遊戲中擊敗5名玩家的能力為利用AI解決現實世界中各種各樣的問題提供了新機會。(編譯/蘇佳維)


※中國人首次當選聯合國糧農組織總幹事 德媒:具有重要戰略意義
※研究稱海平面上升或致美國30個城市「百年內變澤國」
TAG:參考消息 |