登上 Science，AlphaZero完整論文首次發布

探索 12-08

經過數月的反覆修改，DeepMind 最強棋類遊戲 AI AlphaZero 的完整版論文終於在 Science 發表。

17 年 12 月發表在 arxiv 上的 AlphaZero 預印版論文就曾引發廣泛討論，但當時並未經過同行評議，如今經過過同行評議的 AlphaZero 完整論文的發布，將其再次拉回大眾視野。

圖丨此次論文對應的封面（來源：Science）

自從 DeepMind 的 AlphaGo 在圍棋賽場上一戰成名之後，這家 Google 旗下的人工智慧公司並沒有停止前進的腳步，又推出了實力更強的 AlphaZero，AlphaZero 首先經過 8 個小時的對世界頂級圍棋棋譜的學習，就成功擊敗了與李世石對戰的 AlphaGo ；又經過了 4 個小時的訓練，它又擊敗了世界頂級的國際象棋程序——Stockfish；緊接著，又是 2 個小時的訓練之後，世界上最強的日本將棋程序 Elmo 又敗在了它的手下。

在不到 24 小時，同一個電腦程式就可以教會自己玩三種複雜的棋盤遊戲，而且是超越人類的水平，這無疑是 AI 世界的新創舉。

圖|AlphaZero完整版論文（圖源：Science）

對於此次發表在 Science 的論文，20 年前曾輸給 IBM 深藍的國際象棋世界冠軍 Kasparov 今天也在 Science 發表評論，他認為，AlphaZero 不是用其驚人的速度來處理人類的指令和知識，而是可以生成自己的指令，並且 AlphaZero 還會形成自己下棋的風格。

從一開始，AlphaZero 就不是針對某一種棋類被專門開發出來的，在不同的棋類遊戲中，它只是被傳授一些基本的規則，但更高級別類似戰略策略等則完全沒有被傳授，只憑藉 AlphaZero 自己反覆的從訓練和實戰中獲得經驗。

對此，DeepMind 的首席執行官兼聯合創始人 Demis Hassabis 示:「AlphaZero 從完全隨機的遊戲開始學習，逐漸開始學會分辨遊戲的好壞，並形成了自己對遊戲的評價。從這個意義上來講，它並不會受到人類思考遊戲方式的限制。」

DeepMind 的目標一直是打造通用的 AI 機器，Hassabis 就曾表示，他希望能夠幫助解決科學問題，像是設計新葯、發現新材料等。而不僅僅是研發打敗人類的象棋程序。

包括前幾天 DeepMind 推出 AlphaFold 人工智慧系統，能夠快速準確地預測並生成蛋白質的空間結構，並在 CASP 蛋白質摺疊大賽擊敗其餘選手，摘得桂冠。這些都是 DeepMind 目前在健康相關方面的嘗試。

Hassabis 表示：「AlphaZero 是我們通往 AI 成功之路的基石，DeepMind 的目標是利用 AlphaZero 的研發經驗，解決真正具有挑戰性的問題。」

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自煎蛋的精彩文章:

※今年世界上一半的降水全部發生在12天的時間裡
※奇異星球：與世隔絕的非洲鱷魚洞

TAG:煎蛋 |