AI巨頭Facebook悄悄參賽被虐，《星際爭霸》是簡單推理遊戲還是AI試金石？

新聞 10-10

上周日，由美國人工智慧協會（AAAI）所贊助的、第十三屆人工智慧和交互數字娛樂大會（Conference on Artificial Intelligence and Interactive Digital Entertainment 簡稱 AIIDE'17）舉辦的星際爭霸 AI 比賽閉幕了。

本屆比賽的亮點莫過於 Facebook 的參賽：本屆一個叫 CherryPi 的星際爭霸 AI 是由 8 名 Facebook 人工智慧研究實驗室（FAIR Facebook AI Research Lab）的員工和相關人員創造的。不過，比 Facebook 毫無聲息的參賽更驚人的是，比賽的結果顯示 Facebook 竟然被超越了：本屆前三名全是獨立的發燒友，而 CherryPi 連前五都沒進，只是第六名。

僅僅從 Facebook 參加這個著名的比賽這一舉動來看，科技巨頭爭奪「XX 智力遊戲首勝人類冠軍」這一頭銜已經越來越激烈化了。先有 IBM 的「深藍」計算機於 1997 年戰勝國際象棋世界冠軍，後有谷歌的 AlphaGo 於去年戰勝圍棋世界冠軍。而現在，人工智慧界的下一個目標則是即時戰略遊戲了。在今年 8 月，谷歌旗下人工智慧公司（也是 AlphaGo 的創造者）DeepMind 就曾公開宣布，星際爭霸 2 將會是其下一個目標。

圖丨 DeepMind 與 8 月 9 日在其技術博客上公開宣布將與暴雪遊戲合作，開發星際爭霸 2 的 AI 機器學習工具組：SC2LE（星際 2 學習環境）

而之所選擇星際爭霸 2，也是因為其作為即時戰略遊戲中的「即時」和「戰略」恰恰是人工智慧在創新之路上需要挑戰的。

就拿「即時」來說。或許對於人類，星際 2 的那 300 多個基礎操作的「操作空間」（Action Space）並不龐大。但是對於機器，星際 2 的分級操作，外加「升科技」所帶來指令的變化，再加上地圖的體積，其操作空間是無窮大的。比如「農民建房子」這個簡單的行動就有 6 個不同的步驟：點擊滑動滑鼠選擇單位，B 選擇建造，S 選擇供給站，滑動滑鼠選擇位置，點擊建造。僅在一個 84x84 的屏幕上，機器的操作空間有大約 1 億個可能的操作。面對著如此大的操作量，機器該如何有效的進行即時控制正是 DeepMind 和暴雪所推出的工具試圖解決的。

圖丨來自 DeepMind 官博的農民建房子動圖

DeepMind 表示，其 PySC2 環境包裝可以為 AI 玩家提供一個「靈活又簡單的界面」。在初版的工具中，遊戲中的每個元素，比如每種單位、血量、地圖上可見的部分等都會擁有一個單獨的特徵層。這意味著研究人員們可以針對不同的特徵（元素）進行開發和優化，有效的提高 AI 玩家的即時控制能力。

當然，星際 2 還有一些難題暫時沒有技術手段解決，比如「戰略」。作為一個戰略遊戲，很多時候，玩家做出的決定往往只會在十幾甚至幾十分鐘之後才會產生效果。因此，AI 玩家需要學會計劃。

而雖然 AIIDE 的比賽所使用的是星際爭霸 1，但這並不意味著它更簡單。畢竟這款遊戲所要求的核心技術與星際爭霸 2 無差。目前，由著名人工智慧學者、卷積神經網路發明人 Yann Lecun 所帶領、旗下有著超過 150 名頂尖研究員的 Facebook 人工智慧研究實驗室一共只發表了三篇跟星際爭霸有關的論文。不過，雖然 Facebook 沒有任何公開的宣言，但是很顯然他們並不打算將「星際爭霸 AI 冠軍」這一成就拱手相讓。

圖丨 Facebook 人工智慧實驗室主任 Yann Lecun

眾所周知，扎克伯格曾提過 Facebook 的未來有三個主要的發展方向，：連接世界、人工智慧和虛擬現實。而毫無疑問， Facebook 人工智慧研究實驗室就承擔了人工智慧的重任，他們並沒有近期產品的開發壓力，專註於基礎科學和長期方向上的研究。而且，為了爭奪在人工智慧領域的制高點，Facebook 還宣布對 AI 領域的投資額提高三倍，除此以外，Facebook 旗下目前還有由機器學習專家 Joaquin Candela 領導的應用機器學習部門（AML），他們對人工智慧的重視由此可見一斑。

但是從本屆比賽的成績來看，Facebook「爭霸」之路似乎沒有那麼簡單。本屆的冠軍軟體——ZZZKBot——是由來自澳大利亞珀斯的 Chris Coxe、一位軟體開發者獨自完成的。他曾在最終成績揭曉前一天表示「它本來是一個概念驗證。它的源代碼挺爛的。」（當然，它和所有星際爭霸 AI 一樣，人類專業選手，甚至技術好的業餘選手都可以將它輕易戰勝。）

不過，Facebook 和谷歌對於星際爭霸 AI 的思路與獨立發燒友的思路並不一樣。目前領先的星際爭霸 AI 都是基於開發者人工編寫的規則和策略。就拿本屆的冠軍來說，Coxe 表示，ZZZKBot 中最強大的功能也只是一個簡單的學習功能：它可以針對一個對手嘗試多個事先編好的策略，找出其中最有效的策略，然後在複賽中直接採取這個策略。

科技巨頭們則計劃在其星際爭霸 AI 中注重使用機器學習，讓它們可以通過觀察海量的比賽數據和進行嘗試後，自主創造出策略。而這也是讓谷歌 AlphaGo 登頂的核心技術。（有趣的是，Facebook 並沒有在 CherryPi 中採取這一方式。）

不過，隨著谷歌和 Facebook 等技術巨頭陸續進場，由技術發燒友獨自開發出可以獲勝的星際爭霸 AI 軟體的好日子不會有多久了。至於人類世界冠軍，按照人工智慧技術井噴式的發展速度，估計也不會有太多的優勢了。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 DeepTech深科技 的精彩文章:

※只要有了這個「觸手」，機器人也能有觸覺
※大發現！東亞人體內的尼安德特人DNA比例達2.6％，世界最高

TAG:DeepTech深科技 |