當前位置:
首頁 > 知識 > DeepMind高管回答:Alpha zero 的強化學習是否真的不要訓練數據?

DeepMind高管回答:Alpha zero 的強化學習是否真的不要訓練數據?

在MIT的達沃斯討論會上,DeepMind 的聯合創始人Mustafa Suleyman 被問到Alpha zero 的強化學習是否真的證明可以不要訓練數據?除了遊戲還有什麼應用?

DeepMind 的聯合創始人Mustafa Suleyman 非常坦誠地說:alpha zero 只是在三個前提條件成立的情況能夠工作:

可預測環境(圍棋規則);

清晰獎勵系統(輸贏);

無變數(variability) ;

Mustafa Suleyman還表示,他們正在探索在遊戲之外的應用,但是初步預測這不會是很容易的,因為真實世界比遊戲複雜很多,他預測會需要3-5年時間。

他也提到:alpha zero 本身並不能帶來AI對於數據的需求,但是他覺得在數據生成和模擬上的進步(比如說用真實語音合成、人臉合成、甚至類似Grand theft auto來做自動駕駛的模擬)是有可能在未來自動產生可補充的數據。(內容來自:李開復老師朋友圈)


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 AI講堂 的精彩文章:

麥肯錫的研究總監:2030年前,將有4-8億人找不到適合工作

TAG:AI講堂 |