當前位置:
首頁 > 探索 > 登上 Science,AlphaZero完整論文首次發布

登上 Science,AlphaZero完整論文首次發布

經過數月的反覆修改,DeepMind 最強棋類遊戲 AI AlphaZero 的完整版論文終於在 Science 發表。

17 年 12 月發表在 arxiv 上的 AlphaZero 預印版論文就曾引發廣泛討論,但當時並未經過同行評議,如今經過過同行評議的 AlphaZero 完整論文的發布,將其再次拉回大眾視野。

圖丨此次論文對應的封面(來源:Science)

自從 DeepMind 的 AlphaGo 在圍棋賽場上一戰成名之後,這家 Google 旗下的人工智慧公司並沒有停止前進的腳步,又推出了實力更強的 AlphaZero,AlphaZero 首先經過 8 個小時的對世界頂級圍棋棋譜的學習,就成功擊敗了與李世石對戰的 AlphaGo ;又經過了 4 個小時的訓練,它又擊敗了世界頂級的國際象棋程序——Stockfish;緊接著,又是 2 個小時的訓練之後,世界上最強的日本將棋程序 Elmo 又敗在了它的手下。

在不到 24 小時,同一個電腦程式就可以教會自己玩三種複雜的棋盤遊戲,而且是超越人類的水平,這無疑是 AI 世界的新創舉。

圖|AlphaZero完整版論文(圖源:Science)

對於此次發表在 Science 的論文,20 年前曾輸給 IBM 深藍的國際象棋世界冠軍 Kasparov 今天也在 Science 發表評論,他認為 ,AlphaZero 不是用其驚人的速度來處理人類的指令和知識,而是可以生成自己的指令,並且 AlphaZero 還會形成自己下棋的風格。

從一開始,AlphaZero 就不是針對某一種棋類被專門開發出來的,在不同的棋類遊戲中,它只是被傳授一些基本的規則,但更高級別類似戰略策略等則完全沒有被傳授,只憑藉 AlphaZero 自己反覆的從訓練和實戰中獲得經驗。

對此,DeepMind 的首席執行官兼聯合創始人 Demis Hassabis 示:「AlphaZero 從完全隨機的遊戲開始學習,逐漸開始學會分辨遊戲的好壞,並形成了自己對遊戲的評價。從這個意義上來講,它並不會受到人類思考遊戲方式的限制。」

DeepMind 的目標一直是打造通用的 AI 機器,Hassabis 就曾表示,他希望能夠幫助解決科學問題,像是設計新葯、發現新材料等。而不僅僅是研發打敗人類的象棋程序。

包括前幾天 DeepMind 推出 AlphaFold 人工智慧系統,能夠快速準確地預測並生成蛋白質的空間結構,並在 CASP 蛋白質摺疊大賽擊敗其餘選手,摘得桂冠。這些都是 DeepMind 目前在健康相關方面的嘗試。

Hassabis 表示:「AlphaZero 是我們通往 AI 成功之路的基石,DeepMind 的目標是利用 AlphaZero 的研發經驗,解決真正具有挑戰性的問題。」

-

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 煎蛋 的精彩文章:

今年世界上一半的降水全部發生在12天的時間裡
奇異星球:與世隔絕的非洲鱷魚洞

TAG:煎蛋 |