當前位置:
首頁 > 新聞 > AI巨頭Facebook悄悄參賽被虐,《星際爭霸》是簡單推理遊戲還是AI試金石?

AI巨頭Facebook悄悄參賽被虐,《星際爭霸》是簡單推理遊戲還是AI試金石?

上周日,由美國人工智慧協會(AAAI)所贊助的、第十三屆人工智慧和交互數字娛樂大會(Conference on Artificial Intelligence and Interactive Digital Entertainment 簡稱 AIIDE'17)舉辦的星際爭霸 AI 比賽閉幕了。

本屆比賽的亮點莫過於 Facebook 的參賽:本屆一個叫 CherryPi 的星際爭霸 AI 是由 8 名 Facebook 人工智慧研究實驗室(FAIR Facebook AI Research Lab)的員工和相關人員創造的。不過,比 Facebook 毫無聲息的參賽更驚人的是,比賽的結果顯示 Facebook 竟然被超越了:本屆前三名全是獨立的發燒友,而 CherryPi 連前五都沒進,只是第六名。

僅僅從 Facebook 參加這個著名的比賽這一舉動來看,科技巨頭爭奪「XX 智力遊戲首勝人類冠軍」這一頭銜已經越來越激烈化了。先有 IBM 的「深藍」計算機於 1997 年戰勝國際象棋世界冠軍,後有谷歌的 AlphaGo 於去年戰勝圍棋世界冠軍。而現在,人工智慧界的下一個目標則是即時戰略遊戲了。在今年 8 月,谷歌旗下人工智慧公司(也是 AlphaGo 的創造者)DeepMind 就曾公開宣布,星際爭霸 2 將會是其下一個目標。

圖丨 DeepMind 與 8 月 9 日在其技術博客上公開宣布將與暴雪遊戲合作,開發星際爭霸 2 的 AI 機器學習工具組:SC2LE(星際 2 學習環境)

而之所選擇星際爭霸 2,也是因為其作為即時戰略遊戲中的「即時」和「戰略」恰恰是人工智慧在創新之路上需要挑戰的。

就拿「即時」來說。或許對於人類,星際 2 的那 300 多個基礎操作的「操作空間」(Action Space)並不龐大。但是對於機器,星際 2 的分級操作,外加「升科技」所帶來指令的變化,再加上地圖的體積,其操作空間是無窮大的。比如「農民建房子」這個簡單的行動就有 6 個不同的步驟:點擊滑動滑鼠選擇單位,B 選擇建造,S 選擇供給站,滑動滑鼠選擇位置,點擊建造。僅在一個 84x84 的屏幕上,機器的操作空間有大約 1 億個可能的操作。面對著如此大的操作量,機器該如何有效的進行即時控制正是 DeepMind 和暴雪所推出的工具試圖解決的。

圖丨來自 DeepMind 官博的農民建房子動圖

DeepMind 表示,其 PySC2 環境包裝可以為 AI 玩家提供一個「靈活又簡單的界面」。在初版的工具中,遊戲中的每個元素,比如每種單位、血量、地圖上可見的部分等都會擁有一個單獨的特徵層。這意味著研究人員們可以針對不同的特徵(元素)進行開發和優化,有效的提高 AI 玩家的即時控制能力。

當然,星際 2 還有一些難題暫時沒有技術手段解決,比如「戰略」。作為一個戰略遊戲,很多時候,玩家做出的決定往往只會在十幾甚至幾十分鐘之後才會產生效果。因此,AI 玩家需要學會計劃。

而雖然 AIIDE 的比賽所使用的是星際爭霸 1,但這並不意味著它更簡單。畢竟這款遊戲所要求的核心技術與星際爭霸 2 無差。目前,由著名人工智慧學者、卷積神經網路發明人 Yann Lecun 所帶領、旗下有著超過 150 名頂尖研究員的 Facebook 人工智慧研究實驗室一共只發表了三篇跟星際爭霸有關的論文。不過,雖然 Facebook 沒有任何公開的宣言,但是很顯然他們並不打算將「星際爭霸 AI 冠軍」這一成就拱手相讓。

圖丨 Facebook 人工智慧實驗室主任 Yann Lecun

眾所周知,扎克伯格曾提過 Facebook 的未來有三個主要的發展方向,:連接世界、人工智慧和虛擬現實。而毫無疑問, Facebook 人工智慧研究實驗室就承擔了人工智慧的重任,他們並沒有近期產品的開發壓力,專註於基礎科學和長期方向上的研究。而且,為了爭奪在人工智慧領域的制高點,Facebook 還宣布對 AI 領域的投資額提高三倍,除此以外,Facebook 旗下目前還有由機器學習專家 Joaquin Candela 領導的應用機器學習部門(AML),他們對人工智慧的重視由此可見一斑。

但是從本屆比賽的成績來看,Facebook「爭霸」之路似乎沒有那麼簡單。本屆的冠軍軟體——ZZZKBot——是由來自澳大利亞珀斯的 Chris Coxe、一位軟體開發者獨自完成的。他曾在最終成績揭曉前一天表示「它本來是一個概念驗證。它的源代碼挺爛的。」(當然,它和所有星際爭霸 AI 一樣,人類專業選手,甚至技術好的業餘選手都可以將它輕易戰勝。)

不過,Facebook 和谷歌對於星際爭霸 AI 的思路與獨立發燒友的思路並不一樣。目前領先的星際爭霸 AI 都是基於開發者人工編寫的規則和策略。就拿本屆的冠軍來說,Coxe 表示,ZZZKBot 中最強大的功能也只是一個簡單的學習功能:它可以針對一個對手嘗試多個事先編好的策略,找出其中最有效的策略,然後在複賽中直接採取這個策略。

科技巨頭們則計劃在其星際爭霸 AI 中注重使用機器學習,讓它們可以通過觀察海量的比賽數據和進行嘗試後,自主創造出策略。而這也是讓谷歌 AlphaGo 登頂的核心技術。(有趣的是,Facebook 並沒有在 CherryPi 中採取這一方式。)

不過,隨著谷歌和 Facebook 等技術巨頭陸續進場,由技術發燒友獨自開發出可以獲勝的星際爭霸 AI 軟體的好日子不會有多久了。至於人類世界冠軍,按照人工智慧技術井噴式的發展速度,估計也不會有太多的優勢了。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 DeepTech深科技 的精彩文章:

只要有了這個「觸手」,機器人也能有觸覺
大發現!東亞人體內的尼安德特人DNA比例達2.6%,世界最高

TAG:DeepTech深科技 |