當前位置:
首頁 > 最新 > 柯潔惜敗,那又如何?

柯潔惜敗,那又如何?

本文作者付曉萌,三節課新媒體運營喵。

5小時的對弈後,世界第一柯潔惜敗。

今天下午,浙江烏鎮舉行了「人機終極對決」的第一局,世界排名第一的中國圍棋選手柯潔,以四分之一子輸給了 Google 旗下的人工智慧程序 AlphaGo 。各家媒體第一時間紛紛報道此事,我們為大家摘取了部分媒體的精彩觀點,與你共享。

一、更強的 AlphaGo

本次和柯潔對決的並不是一年前和李世石對決的 AlphaGo 了,而是升級版的 AlphaGo 。據DeepMind 的創始人 Demis Hassabis 透露,當前AlphaGo版本比跟李世石下棋的版本快10倍,硬體方面利用的谷歌自主研發的TPU,之後還會公布該版本AlphaGo更多的技術細節。

去年和李世石對決的 AlphaGo 是巧妙地混合了三種演算法:蒙特卡洛樹搜索+監督學習+增強學習。

簡單介紹

蒙特卡洛樹搜索:通過值網路來評估大量選點,並通過策略網路選擇落點;

監督學習:通過學習3000萬步人類棋譜,對六段以上職業棋手走棋規律進行模仿;

增強學習:兩台AlphaGo從自我對戰中學習如何下棋。

搜狗公司CEO@王小川在知乎上根據公開資料,推測了此次AlphaGo2.0 與AlphaGo1.0 在技術原理上的不同之處:

1. 放棄了監督學習,沒有再用人的3000萬局棋譜進行訓練。這本是AlphaGo最亮眼的演算法,也是今天主流機器學習不可避免的核心條件:依賴於優質的數據,在這個特定問題下就這麼被再次突破了。

2. 放棄了蒙特卡洛樹搜索,不再進行暴力計算。理論上,演算法越笨,就越需要暴力計算做補充。演算法越聰明,就可以大大減少暴力計算。從AlphaGo 2.0的「馬甲」Master的歷史行為看,走棋非常迅速,約在每10秒鐘就走棋一步,如此速度很可能是放棄了暴力的計算。

3. 極大地強化了增強學習的作用,之前敲邊鼓的演算法,正式成為扛把子主力。想想看有多勵志:兩台白痴機器,遵守走棋和獲勝規則,從隨機走棋開始日夜切磋,總結經驗,不斷批評和自我批評,一周後終成大器。

@王小川猜測,AlphaGo 2.0對計算資源開銷極小,把當前棋局輸入神經網路,電流流過,輸出就是最佳的走棋方案。如此演算法下,有可能僅僅依靠一個GPU工作,每一步棋消耗的能源接近人的大腦。

也就是說,此次柯潔所面對的,是更強、更難應對的 AlphaGo 。

@愛范兒今日第一時間推送的《柯潔輸了!人不是那個人,「狗」更不是那個「狗」》一文中,作者@李帥飛&常岩也指出了AlphaGo2.0 的駭人之處:

它已經跳出了學習人類棋盤的方法,而進入了自己左右手互搏,自己學習各種情況的局面,一方面它所學習到的棋局廣度非人類可想像,另一方面它的出招可能越來越沒有「套路」可言。更別提 AlphaGo 只要有電就可以無休止學習這件事了,由於圍棋本身有明確的規則判斷勝負,所以 AlphaGo 可以在無需人類標註的情況下就能判斷自己出招的好壞,更是強化學習的一大優勢。

意思很明顯,現在的「狗」,是人類智慧和機器智慧的結合體了。

二、勝負既已定,為何還要繼續?

比賽開始前,很多媒體和網友都對這場比賽做過預測,認為升級後的 AlphaGo 恐將完勝柯潔。柯潔在昨晚自己的微博長文《最後的對決》中也有說到,現在的AI進步之快遠超我們的想像......我相信未來是屬於人工智慧的。

李開復曾預料:人類的勝算恐怕為零,勝負已經意義不大了。

棋聖聶衛平也表示:我預測結果是 0 比 3,AlphaGo 勝出。

明知勝負已定,那為何人機對抗還要繼續下去呢?《柯潔輸了!人不是那個人,「狗」更不是那個「狗」》就引用了《智能革命》一文中李彥宏的說法:

2017 年初,AlphaGo 的變身 Master 橫掃中韓頂級高手,一時間人們分化為悲觀派、降臨派、冷靜派、腦洞派……我們希望有更多人是默默學習派。

並認為,進行 AI 與人類的對抗,根本目的還是檢驗和優化演算法,並且力爭在其他更有價值的行業中進行應用:

從最初的 AlphaGo,到 Master,再到今天的 AlphaGo,三代產品,三段歷程,對應的恰好是「理論,實驗,再創新」的三段論。

而這種基於互聯網大數據的深度學習和決策支持系統,將在很多人類算力不可及的領域提供支撐。

文中也提到了 Google 大中華區總裁石博盟所透露的:AlphaGo 的第一個結合點會是醫療領域,AI 將在一定準確率的情況下,給予醫生診療判定方面的輔助,對於糖尿病、癌症等疾病的治療和研究大有裨益。

而未來在更大的深度和廣度上,AlphaGo 積累的決策模型,將逐漸把人力從需要反覆的勞動中解放出來,同時對腦力勞動進行反哺,對絕大多數社會元素進行快速解構並解讀,再反饋給人類。

如同去年大熱的科幻片《降臨》一樣,人工智慧與人類本體,終將會找到一條智慧結合的發展大路。

三、對決的意義

去年李世石與AlphaGo的人機圍棋對戰大比分1:3的時候,@黃有璨寫了一篇文章《李世石所面臨的拷問,也許可以在中找到答案》,文中,黃有璨對比分表達了感傷:

一個天才級的職業棋手,理當是視自己的名譽和技藝為性命的,但與AlphaGo的這輪對決,在前三局李世石是完敗。

要知道,這場完敗,可能不僅會影響到他的名譽,甚至,更加可怕的是,他作為一位棋手的職業信仰——甚至可能不只是他,所有職業棋手們的職業信仰都將從此受到巨大的挑戰。

之後,黃有璨提出了一個問題:假如機器的計算能力已經強大到了遠超人類的地步,以至於在一些複雜決策上已經可以比人更加智能,那麼人類的出路在哪裡?甚至是,人類存在的意義在哪裡?而人類,又是否會逐漸被機器所奴役?

沿著這個命題,他提到了劉慈欣的一部短篇科幻小說,情節大概是這樣的:

某一天,人類終於遇到了一個科技發展程度遠超自己的外星種族,對方是一個技術驅動的種族,他們的技術能力和已有的運算能力,成百上千倍於人類,以至於人類世界中的一切,在對方眼中,都是自己藉助技術可以輕易實現的,看起來都如此破舊和不值一提。

在如此巨大的差距面前,外星種族認為人類世界中的一切都是無意義的,想要毀滅掉人類世界中的一切。

但,人類代表在與對方對話時,顯得執著又頑固,他們堅稱,人類世界中的有些東西,是哪怕科技程度發展遠超人類的外星種族都做不到的。比如:詩歌,尤其是那種可以帶來一種直擊人類心靈的美感的作品。

崇尚以科技為核心的外星種族被這個觀點激怒了,他們試圖要憑藉科技寫出超越人類偉大詩人——李白的詩歌,為此,他們開發了計算能力強大到了極致的程序,甚至開始讓程序模仿李白在寫詩前的一切行為,依靠學習獲得相似的體驗,例如:飲酒、遊山玩水、美色相伴。

在技術的驅動下,外星種族試圖去結構和分解所有這些體驗背後的一切,獲得「偉大的詩」產生背後的特定邏輯。但,最終外星文明痛苦的發現,在技術和演算法的推動下,自己雖然已經能夠寫出一些不錯的詩,但它們並未能夠寫出超越李白的詩歌。因為,很多時候,偉大詩歌的創作,都是非邏輯的。

於是,為了寫出超越李白的詩,技術驅動下的外星文明想到了另一條理論上可行的路徑——窮舉法。也即,在符合韻律等規則的情況下,把所有可能的字片語合都窮舉出來。

最終,外星文明成功的完成了這一壯舉——不計其數的詩歌被創作了出來,其中也必定包含了那些能夠超越李白的詩歌。

但是,外星種族最終仍然認輸了。

因為,雖然那些詩歌上的巔峰之作已經必然被創作了出來,但外星種族卻無法開發出一個具備詩歌鑒賞能力的程序,也就無法藉助偉大的技術把這些巔峰之作從幾億億首詩中檢索出來。

這意味著,技術層面上外星種族雖然已經確實超越了李白,但他們卻仍然沒有真正得到和擁有那些巔峰之作,因為它們無法被找到,無法被鑒賞,更無法被品味。

以上情節,我們可以認為:即使外星文明的技術能力和運算能力,甚至是作詩的能力都超過了人類,也不代表人類就輸了,因為他們不具備鑒賞的能力。@半輕人推送的《柯潔 vs. Google AlphaGo 第一局速記》一文中, 作者@王詠剛從哲學的角度也提到了對決的意義:

圍棋之道,如只論勝負,人類的所有圍棋書都可以燒了。還好,人類還可以在圍棋中求快樂,求感悟,求哲理。

文中,作者引用了職業棋手李喆說的話,他讀哲學的一個目的是為了探究下圍棋這件事對人類社會而言到底有何價值。人工智慧來了,人們其實也可以從哲學層面去探究,人這樣一種神奇的存在對宇宙而言到底有何價值。如果我們只是宇宙的偶然過客,那我們有什麼資格對機器智慧品頭論足?人的智慧和機器的智慧真的有高低貴賤之分?

AlphaGo 的創造者——人工智慧企業 DeepMind 的創始人 Demis Hassabis 表達了這場比賽的最終目的是去學習、探索圍棋的真諦:

這絕不是人和電腦之間的對抗,這是人用機器發現新的知識,就像哈勃望遠鏡,它能帶來新的奧秘的發現。同時,它也能用在其他的領域,比如在製藥、醫療等方面,都可以使用人工智慧來解決疑難問題。比如 Google 目前已經在使用 DeepMind 的技術在數據存儲上節能減排了。而這場比賽的最終目的不是人類獲勝還是機器獲勝,最終目的都是去學習、探索圍棋的真諦。

當然,今天只是柯潔和 AlphaGo 「人機終極對決」的第一局,根據賽事安排,5月25日、27日還有兩場比賽,鹿死誰手尚未有定論,我們可以耐心靜待。

但是,結局或許已經不重要了吧?(完)

這個公號的主人趙曉璃老師,是一位知性的暢銷書作者,她的公號內容,多聚焦於職場問題、職業規劃等,偶爾犀利,偶爾也會有暖心的雞湯。

職業規劃這個東西怎麼說呢,本質上我覺得它其實尋求的不是一種確定的答案,而是一種對自己的了解。就像一家企業和一個公司的發展過程中面臨決策時如果有一些模型或工具幫助你來進行輔助判斷可能會讓你更清晰更高效一樣,職業規劃的各種工具和方法對一個人的作用可能也是類似的。

如果你正好處於職業生涯的轉型期、或者對於未來還不是那麼清晰,不妨可以關注下趙老師的公號,相信會有收穫的。

掃這裡

掃這裡

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 3節課 的精彩文章:

TAG:3節課 |