當前位置:
首頁 > 科技 > 「阿爾法狗」退役,除了不敗神話,它還留下了什麼?

「阿爾法狗」退役,除了不敗神話,它還留下了什麼?

Xtecher【錯別字基金】溫馨提示:如果您在閱讀過程中發現錯別字,請在文章底部留下說明+聯繫方式,我們會立刻發給您5-88元隨機紅包一個,同樣的紅包會發給文末留言點贊最高者。

柯潔在此次「人機大戰」之前表示,這將是他最後一次和人工智慧棋手比賽。柯潔三盤盡墨之後,阿爾法狗之父、DeepMind創始人戴密斯·哈薩比斯也表態說,這是阿爾法狗最後一次和人類對弈。

不過,哈薩比斯同時表示,人類棋手與阿爾法狗的故事並不會就此結束。

來源|AI世代

編輯|陳光

微信公眾號ID|Xtecher

在最後一局比賽結束後的發布會上,AlphaGo之父、DeepMind創始人戴密斯·哈薩比斯(Demis Hassabis)說:「本周的比賽聚集了圍棋起源地最優秀的棋手參與,是AlphaGo作為一個競賽系統能夠對弈的最高級別對手。因此,本次中國烏鎮圍棋峰會是AlphaGo參加的最後一次比賽。」

不過,哈薩比斯宣布,人類棋手與AlphaGo的故事並不會就此結束。

AlphaGo的啟蒙老師、歐洲圍棋冠軍樊麾隨後表示:「我們將與柯潔共同研究這三局比賽,做成視頻,與全世界圍棋愛好者共同分享。我們還給全世界圍棋愛好者準備了一份禮物,這些自我對戰是阿爾法狗最寶貴的財富,我們近期會公布50副阿爾法狗自我對戰的棋譜,以慢棋的形式進行。」

AlphaGo是一款圍棋人工智慧程序,由谷歌旗下DeepMind公司的戴密斯·哈薩比斯、大衛·席爾瓦、黃士傑與他們的團隊開發。柯潔是中國圍棋職業九段棋手,他也是圍棋等級分排名世界第一。

區別於和李世石對弈的AlphaGo1.0,此次對戰柯潔的AlphaGo2.0採用了新的演算法模型。此前,該版本曾化名「Master」,以在線對弈的形式擊敗了包括柯潔在內的所有對手,60戰無一敗績。

據DeepMind介紹,1.0版本的AlphaGo是「深度學習」人類棋譜得出圍棋手數的估值,AlphaGo 1.0所走招法其實並沒有脫離人類的理解,而且都是人類棋手曾下過的棋。如果AlphaGo1.0完善到極致,就意味著得出了接近完美的圍棋手數估值函數。2.0版本AlphaGo利用這個估值函數自我對局和「深度學習」,不再受人類棋譜的局限,下出真正屬於「人工智慧」的圍棋。

兩次與現場預判相反的逆轉

從最初看不上眼,到贏了韓國棋手李世石之後被震驚,再到稱呼AlphaGo為「阿老師」,人類棋手不斷調整著對於人工智慧最新代表者AlphaGo的認知。峰會上,最讓中國棋手渴望和興奮的是找到AlphaGo一些破綻。

中國圍棋隊總教練俞斌曾表示,AlphaGo的弱點,在去年對李世石第四盤中所表現出來的「無中生有」的失誤,當李世石下出第78手妙棋之後,AlphaGo開始失常。他將這種失誤稱為「開放性計算的誤算」。這種誤算在AlphaGo對李世石第五局的角上計算也出現過。

人們覺得AlphaGo是電腦,擅長計算,可能不擅長從大局考慮。經過幾番對戰,棋手們推翻了此前判斷,他們發現AlphaGo駕馭大局能力並不比人類弱,幾乎無懈可擊。又有人大膽提出,AlphaGo可能擅長布局,不擅長計算;還有人提出AlphaGo下棋,重撈實地,不重形勢。像盲人摸象,人類棋手不停地嘗試著。

另外,有棋手們推斷,人工智慧圍棋經常走棋時刪繁就簡,不造劫材,可能不擅長「應劫」,多多打劫可能會讓電腦犯糊塗,並舉出網上一些贏了AI圍棋的例子證明,不斷挑起肉搏,在亂戰中尋找機會殺死AI圍棋大龍方才有獲勝機會。

以上這些因暫時沒有人類戰勝AlphaGo和今年初AlphaGo匿名化身的Master,無從證明。

倒是現場解說員,對於棋盤上勝負預期兩次與最終AlphaGo走出的結果完全相反,著實讓現場的觀眾和解說員一起長時間緩不過勁來。

第一次來自柯潔25日與AlphaGo的第二場比賽。開局至前100手,棋手古力九段根據柯潔臉上表情、較少揪頭髮的動作和棋盤上局勢得出柯潔的棋相當樂觀,有獲勝的希望。「AlphaGo之父」哈薩比斯(Demis Hassabis)在11:32通過社交網路對外稱:「根據AlphaGo的評估,柯潔此時此刻下的非常完美。」當時比賽還在進行當中,這條推文截圖立刻在現場傳播。觀眾有些興奮,期待柯潔代表人類給機器一個教訓。

這個希望隨著柯潔投子認輸而泯滅。

第二次是26日上午連笑+AlphaGo一起對戰古力+AlphaGo,現場氣氛隨著解說員引導,認為時間相對充裕的古力一方勝券在握。結果卻是古力一方AlphaGo主動投降,古力拒絕,下了十來手之後,古力認識到大勢已去,親自舉起投降牌子。

賽後,現場記者追問一名現場解說員「為何出現逆轉情況」,「AlphaGo和古力誰下出惡手」等問題,此位解說員的思緒卻一直停留在比賽中,難以回神應答。

AlphaGo帶給人類圍棋界的震驚仍然在繼續,並擴大著影響範圍。只是很多人現場見證之後,感受更為深刻——很多人是懵的,包括職業棋手和專家。

這或許意味著,在遠超人類計算能力的人工智慧AlphaGo面前,職業棋手與業餘棋手之間的差距,甚至沒有職業棋手與AlphaGo之間差距大,整個圍棋界將因為AlphaGo的存在引起一些固有結構的崩塌。這之後,誰能有與AlphaGo切磋棋藝的機會,誰就有可能更快地成長,走得更遠。

更強的「阿爾法狗」

5月24日,在新版本AlphaGo首戰以1/4子優勢戰勝柯潔之後,DeepMind創始人兼CEO 哈薩比斯、AlphaGo團隊負責人David Silver在人工智慧高峰論壇上稱:「AlphaGo已經可以模仿人類直覺。在過去一年,我們想打造完美的AlphaGo,彌補它知識方面的空白。因為在與李世石的比賽中,它是有缺陷的。」據介紹,AlphaGo升級後新版本可以讓老版本三個子。

哈薩比斯稱圍棋因為太過複雜,窮舉搜索難以解決。對於計算機來說,圍棋有兩項難題:很難寫出評估程序以決定誰贏;搜索空間太過龐大。

圍棋不像象棋等遊戲靠計算,而是靠直覺。圍棋中沒有等級概念,所有棋子都一樣。圍棋是築防遊戲,因此需要盤算未來。為此,AlphaGo團隊用兩種卷積神經網路去完成:策略網路和估值網路。策略網路的卷積神經網路用於決定下一步落子可能的位置,價值網路用於評估當前棋局獲勝的概率。

為了應對圍棋巨大的複雜性,AlphaGo 採用機器學習技術,結合了監督學習和強化學習的優勢。通過訓練形成一個策略網路(policy network),將棋盤上的局勢作為輸入信息,並對所有可行的落子位置生成一個概率分布。

然後,訓練出一個價值網路(value network)對自我對弈進行預測,以 -1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標準,預測所有可行落子位置的結果。這兩個網路自身都十分強大,而 AlphaGo將這兩種網路整合進基於概率的蒙特卡羅樹搜索(MCTS)中,實現了它真正的優勢。最後,新版的AlphaGo 產生大量自我對弈棋局,為下一代版本提供了訓練數據,此過程循環往複。

地平線創始人、百度前深度學習研究院負責人余凱表示,這次AlphaGo來到中國,技術提升的進步體現在兩方面,一方面是AlphaGo 2.0演算法,更多強調通過自我博弈,加上通過學習人類棋手的歷史數據提升棋藝,一般來說,人工智慧需要大數據,而AlphaGo這種做法,並不需要那麼多大數據,從零開始,提升棋藝。「我覺得這具有革命性意義。」

另一方面,Deepmind母公司自己研發的新型架構處理器TPU的使用,做到了AlphaGo「單機版」,進一步減少了對處理器數量的需求。

曾經,人工智慧學界認為傳統硬體很難進一步提升AlphaGo棋力。去年李世石與AlphaGo開戰之前,創新工場創辦者李開復在知乎上撰文說明,下圍棋計算,需要增加硬體。線性地從1202個CPU增加到1920個CPU,AlphaGo的技戰指數(ELO)只增加了28,並未跟著跳躍增長。

但是,TPU的出現極大地提高了計算性能,同時能耗更小,體積也更小。余凱認為通過TPU加大的計算能力,硬體能力提升使得搜索進入一個更大的求解空間。「硬體提升也是令業界矚目的。」

國內人工智慧晶元研發公司寒武紀曾預言,採用人工智慧晶元,AlphaGo只需要一台個人電腦大小的主機。這次烏鎮圍棋峰會上,雖然Deepmind公司未能完全達到,卻朝這個方面在進步。值得一提的是,寒武紀公司創始人陳天石告訴表示,早期與一位法國專家Olivier Temam一起研究人工智慧晶元,這位法國人後來加入了Deepmind的母公司,成為TPU團隊中一員。

未來,更強的人工智慧晶元的出現,與人類棋手的水平將越拉越遠。

人機對戰歷史

2016年1月,AlphaGo在沒有任何讓子的情況下,以5:0完勝歐洲圍棋冠軍、職業二段選手樊麾,計算機程序能在不讓子的情況下,在完整的圍棋競技中擊敗專業選手,這是第一次。

2016年3月,AlphaGo與圍棋世界冠軍、職業九段選手李世石進行人機大戰,並以4:1的總比分獲勝。谷歌董事長施密特在該比賽的開幕儀式上稱:「無論比賽結果如何,勝者都是人類。」

2016年末2017年初,AlphaGo在中國棋類網站上以Master為註冊帳號與中日韓數十位圍棋高手進行快棋對決,連續60局無一敗績。

不少職業圍棋手認為,AlphaGo的棋力已經達到甚至超過圍棋職業九段水平,2016年7月18日,世界職業圍棋排名網站GoRatings公布最新世界排名,谷歌旗下DeepMind的人工智慧系統AlphaGo以3612分,超越3608分的柯潔成為新的世界第一。

2017年1月,谷歌Deep Mind公司CEO哈薩比斯在德國慕尼黑DLD(數字、生活、設計)創新大會上宣布推出真正2.0版本的AlphaGo。其特點是擯棄了人類棋譜,只靠深度學習的方式成長起來挑戰圍棋的極限。

AlphaGo主要由以下部分組成:走棋網路(Policy Network),給定當前局面,預測/採樣下一步的走棋;快速走子(Fast rollout),目標和走棋網路一樣,但在適當犧牲走棋質量的條件下,速度要比走棋網路快1000倍;估值網路(Value Network),給定當前局面,估計是白勝還是黑勝;蒙特卡洛樹搜索(Monte Carlo Tree Search),把以上這三個部分連起來,形成一個完整的系統。

值得注意的是,AlphaGo並不是DeepMind唯一項目,也不是最大的項目。DeepMind的最終目標是智能助手、醫療和機器人。另外,儘管AlphaGo只是針對圍棋開發的系統,但其原理可以被應用到現實問題中。

━━━━━

封面來源:網路 排版:陳光 校對:陳光

━━━━━

Xtecher官網平台現開通認證作者,

(添加好友請註明公司、職位、事由)

點擊展開全文

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 Xtecher 的精彩文章:

用安全技術+數據來打擊灰產,豈安科技想幫企業每年省1000萬
試錯:這本應該是一個成功的創業故事(2)
A Chinese renaissance:中國生命科學的新千年
五虎上將不敵AlphaGo投子認輸;軟銀擬收購英偉達更多股權
6月10日北美分賽火爆開啟!

TAG:Xtecher |

您可能感興趣

大古的迪迦為什麼是神話?他做到了其他奧特曼做不到的三件事!
不要再神話諸葛亮了,他沒那麼厲害,他只是千古賢相而已
李小龍為什麼被稱為不敗神話,看完這幾項數據你就懂了
一龍的眼淚誰能懂?中國搏擊神話一去不復返,不退役還等啥
一代男團不滅的神話,他們是靠什麼走到了今天呢?
火影忍者鼬神的不敗神話,讓很多想要殺他的人,希望落空了!
那不勒斯能否延續客場不敗神話
西方的不敗神話徹底破滅!美軍要撤走了,阿薩德贏到了最後!
這些健康神話是真的嗎?別再繼續被騙下去了!
鞋櫃里的不老神話,這麼多年誰也沒能把它「干」掉!
「不老神話」趙雅芝做夢都想刪除的舊照,完全看不出!
上世紀被傳為神話的軍用利器三棱軍刺,為什麼現在卻沒落了呢?不要再被神話騙了
他們要打破狄仁傑不敗的神話!
神話歷史中打敗蚩尤的到底是誰呢?你所不知道的那些故事!
上古神話的神仙可以結婚,為啥後來卻不行了?原因揭示了一個真相
特斯拉的神話一旦破滅,後果將會如何?
別再神話特斯拉了,這是在給他抹黑
熱血傳奇:從頁游轉型手游,一直都是不敗神話,只因做到了這一點
「漫談神話」快來看不死心的蚩尤又搞出了什麼幺蛾子
零式戰鬥機的不敗神話為什麼會破滅?竟是因為這偶然的原因