從圍棋到人工智慧

最新 02-21

AlphaGo第一次戰勝人類頂尖棋手後，在網路圍棋界化名Master並戰勝了所有國內一流棋手。而第二代的AlphaZero，又以100:0的成績，戰勝了第一代AlphaGo。這個現象有兩個問題需要我們理解，第一，為什麼Go能戰勝所有人類頂尖棋手？第二，為什麼Zero的提高速度這麼快？

要理解這兩個問題，需要先對電腦棋手的運行方式有所了解，在圍棋之外的其它棋類遊戲中，由於規則和棋盤大小的原因，走棋的可能性數量，是可以被當今的電腦算力所窮舉，也就是說，電腦可以算出每一步後的所有可能性，並在其中挑選最有利的應對步驟，從這個原理來說，只要電腦足夠強大，人腦無法與之匹敵。早些年IBM的深藍計算機，在國際象棋方面就展示了這個原理。但圍棋的規則與其它棋類完全不同，棋盤上19*19的格子，總共有361個交叉點，可以吃掉對方也可以被對方反殺，這就使其落子後的可能性數量組合，接近全宇宙的原子數量（Alpha團隊開發者所言），至少當今人類的電腦算力是無法窮舉所有可能性的。所以，針對傳統棋類遊戲的暴力窮舉法，至少目前對圍棋是沒用的。因此，Alpha團隊的設計者們，為了降低天文數字的計算量，對其改為兩層模式，第一層叫策略計算，只負責動態的對整個棋盤形勢的評估、以及決策未來發展的方向；第二層叫價值計算，只負責未來十幾步的最優走子計算。這樣一來，每個層面需要計算的概率組合數量，就會下降到電腦算力可接受的範圍，由此解決了這個問題。你看，這就像人類社會的分工，有統帥思考決策大政方針，有將軍領兵打仗，各司其職。同樣的電腦算力配置，卻干著不同的工作，而它們組合產生的能力，卻呈現出N倍的效率。這就是為什麼第一代的AlphaGo能戰勝人類的基礎原理，即合理的分工+較強的算力。

光有這些策略和算力，還不足以打敗人類，因為人類有著地球上最高級的能力——學習。顧名思義，就是理解+實踐，就是通過觀察理解和實踐驗證，發現規律，在此之上進一步通過邏輯思考，得出更高級的規律並實踐驗證，由此循環不斷進步，也可以說，這就叫做智慧。因此，AlphaGo要想打敗人類，必須具備智慧的能力，即學習能力。通過學習，就無須窮舉所有可能性而得出較佳結論（注意，不是最佳），這也是為什麼AlphaGo只是以4:1戰勝李世石，而不是全勝。另外，人類棋手每年最多能下幾千局訓練自己，而電腦每天以百萬局的速度訓練，尋找策略和執行層面不同的最優方案並記錄在硬碟上，而人類訓練的結果是形成大腦的直覺反射，可靠性終究不如硬碟來的實在。AlphaZero只用了4塊TPU，在沒有任何人類輸入條件下，白手起家，自己與自己對弈，3天自我訓練了490萬局，然後以100:0擊敗了他的前輩AlphaGo。這就是學習、或者說智慧的能力。而擁有這個能力的電腦，就是人工智慧的典型表現。

好了，現在讓我們用人類智慧的能力思考一下：從Alpha系列在圍棋領域的發展和實踐，我們可以得出一個結論，足夠算力的計算機，在擁有較完善的人工智慧基礎演算法後，它是有可能在幾天或者幾周時間，從零升級到博士學歷級別的智力水平，只要信息量足夠，比如接入互聯網，它有可能在極短的時間內突破各個理論科研領域的尖端極限，而我們人類的博士們，唯一需要做的工作，就是到實驗室里按照它的要求做試驗、並反饋給這個超級電腦。由此擴展推斷，整個社會的發展速度，將會呈現指數級的上升和跨越（巧合的是，從茹毛飲血的上古時代到今天，人類進步的速度也呈現出越來越快的狀態）。由於我們人類大腦的構造和運行原理，是不可能追上電腦的速度，照此發展，很快我們就不能理解這個超級電腦在幹什麼了。這就像是一個世居南美安第斯山脈的土著，看見一個對著手機屏幕又說又笑的現代人一樣，不可理喻。人類要想不被淘汰，唯一能做的就是，升級自己的大腦，將其改造為適合快速運算的機器。而那時，星際探索、外星移民、外星生命、永生等話題，可能就會替代當前的主流話題：掙錢、戰爭、蘋果手機、學區房等等等等。。。。。。

據說，歐美有些富人，開始養生了，目的是保證20年內不要死，主要器官不要出問題。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 supper短線 的精彩文章:

TAG:supper短線 |