當前位置:
首頁 > 最新 > 從圍棋到人工智慧

從圍棋到人工智慧

AlphaGo第一次戰勝人類頂尖棋手後,在網路圍棋界化名Master並戰勝了所有國內一流棋手。而第二代的AlphaZero,又以100:0的成績,戰勝了第一代AlphaGo。這個現象有兩個問題需要我們理解,第一,為什麼Go能戰勝所有人類頂尖棋手?第二,為什麼Zero的提高速度這麼快?

要理解這兩個問題,需要先對電腦棋手的運行方式有所了解,在圍棋之外的其它棋類遊戲中,由於規則和棋盤大小的原因,走棋的可能性數量,是可以被當今的電腦算力所窮舉,也就是說,電腦可以算出每一步後的所有可能性,並在其中挑選最有利的應對步驟,從這個原理來說,只要電腦足夠強大,人腦無法與之匹敵。早些年IBM的深藍計算機,在國際象棋方面就展示了這個原理。但圍棋的規則與其它棋類完全不同,棋盤上19*19的格子,總共有361個交叉點,可以吃掉對方也可以被對方反殺,這就使其落子後的可能性數量組合,接近全宇宙的原子數量(Alpha團隊開發者所言),至少當今人類的電腦算力是無法窮舉所有可能性的。所以,針對傳統棋類遊戲的暴力窮舉法,至少目前對圍棋是沒用的。因此,Alpha團隊的設計者們,為了降低天文數字的計算量,對其改為兩層模式,第一層叫策略計算,只負責動態的對整個棋盤形勢的評估、以及決策未來發展的方向;第二層叫價值計算,只負責未來十幾步的最優走子計算。這樣一來,每個層面需要計算的概率組合數量,就會下降到電腦算力可接受的範圍,由此解決了這個問題。你看,這就像人類社會的分工,有統帥思考決策大政方針,有將軍領兵打仗,各司其職。同樣的電腦算力配置,卻干著不同的工作,而它們組合產生的能力,卻呈現出N倍的效率。這就是為什麼第一代的AlphaGo能戰勝人類的基礎原理,即合理的分工+較強的算力。

光有這些策略和算力,還不足以打敗人類,因為人類有著地球上最高級的能力——學習。顧名思義,就是理解+實踐,就是通過觀察理解和實踐驗證,發現規律,在此之上進一步通過邏輯思考,得出更高級的規律並實踐驗證,由此循環不斷進步,也可以說,這就叫做智慧。因此,AlphaGo要想打敗人類,必須具備智慧的能力,即學習能力。通過學習,就無須窮舉所有可能性而得出較佳結論(注意,不是最佳),這也是為什麼AlphaGo只是以4:1戰勝李世石,而不是全勝。另外,人類棋手每年最多能下幾千局訓練自己,而電腦每天以百萬局的速度訓練,尋找策略和執行層面不同的最優方案並記錄在硬碟上,而人類訓練的結果是形成大腦的直覺反射,可靠性終究不如硬碟來的實在。AlphaZero只用了4塊TPU,在沒有任何人類輸入條件下,白手起家,自己與自己對弈,3天自我訓練了490萬局,然後以100:0擊敗了他的前輩AlphaGo。這就是學習、或者說智慧的能力。而擁有這個能力的電腦,就是人工智慧的典型表現。

好了,現在讓我們用人類智慧的能力思考一下:從Alpha系列在圍棋領域的發展和實踐,我們可以得出一個結論,足夠算力的計算機,在擁有較完善的人工智慧基礎演算法後,它是有可能在幾天或者幾周時間,從零升級到博士學歷級別的智力水平,只要信息量足夠,比如接入互聯網,它有可能在極短的時間內突破各個理論科研領域的尖端極限,而我們人類的博士們,唯一需要做的工作,就是到實驗室里按照它的要求做試驗、並反饋給這個超級電腦。由此擴展推斷,整個社會的發展速度,將會呈現指數級的上升和跨越(巧合的是,從茹毛飲血的上古時代到今天,人類進步的速度也呈現出越來越快的狀態)。由於我們人類大腦的構造和運行原理,是不可能追上電腦的速度,照此發展,很快我們就不能理解這個超級電腦在幹什麼了。這就像是一個世居南美安第斯山脈的土著,看見一個對著手機屏幕又說又笑的現代人一樣,不可理喻。人類要想不被淘汰,唯一能做的就是,升級自己的大腦,將其改造為適合快速運算的機器。而那時,星際探索、外星移民、外星生命、永生等話題,可能就會替代當前的主流話題:掙錢、戰爭、蘋果手機、學區房等等等等。。。。。。

據說,歐美有些富人,開始養生了,目的是保證20年內不要死,主要器官不要出問題。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 supper短線 的精彩文章:

TAG:supper短線 |