當前位置:
首頁 > 新聞 > 台灣圍棋AI黑馬擊敗騰訊絕藝,獨家揭秘四大關鍵

台灣圍棋AI黑馬擊敗騰訊絕藝,獨家揭秘四大關鍵

「贏騰訊絕藝,我自己都嚇呆了」,這是台灣交通大學資訊工程系教授吳毅成,接受DT君採訪時說的第一句話。

圖丨台灣交通大學資訊工程系教授吳毅成。(圖片:詹子嫻)

AlphaGo 擊敗人類棋王的事實,使得全球都加大了對人工智慧的投入。日前,在鄂爾多斯舉辦的中國圍棋大會首屆世界智能圍棋公開賽上,AlphaGo 因宣布退休而沒有參賽,本來不出意外,冠亞軍在騰訊的絕藝和日本老牌圍棋 AI 程序 DeepZenGo 之間產生。殊不知半路衝出一匹大黑馬,擊敗了騰訊的絕藝,奪下亞軍,這隻黑馬就是由吳毅成領軍、台灣交大團隊所開發的圍棋人工智慧「CGI」。

磨練兩年以黑馬姿態崛起

近期 CGI 在國際賽事屢創佳績,包括六月中在福州舉辦的中韓人機配對賽獲得冠軍;七月份在義大利的國際 IEEE FUZZ 會議上,CGI 與台灣的紅面棋王周俊勛對弈兩場,CGI 先是執黑獲得勝利,執白也以 2.5 目取勝,成為全球第一次「學界」圍棋程序在正式比賽擊敗職業九段棋士,又在八月的中國圍棋大會上又勝過騰訊絕藝。

圖丨福州中韓人機配對賽上 CGI 團隊在測試

能得到這樣好的成績,連 CGI 團隊自己也沒想過。CGI 全名是 Computer Games and Intelligence,是吳毅成帶領的電腦遊戲與智能實驗室的縮寫。圍棋智能就是CGI開發的技術之一。CGI是個才出現了短短兩年的圍棋 AI 新手,相比於投入了龐大資源跟資金的絕藝,或是結合了產學之力、過去十年站在領先位置的日本 DeepZenGo,仍然顯得稚嫩。

在 2015 年的初版里,CGI 的棋力大約僅相當於業餘三段水平,因此不被外界看好,中國圍棋世界冠軍柯潔就認為絕藝是勝券在握。

就連 CGI 團隊自己當時也認為,「如果能得到第三就很開心了。」因為在中國圍棋大會比賽之前,團隊對自己及對手進行了分析:儘管 CGI 經過兩年的改進及實戰,實力上已有提升,但始終覺得跟絕藝、DeepZenGo 仍有一段距離。「當時評估在ELO 等級分系統(Elo Rating)中,與 DeepZenGo 還差 100 左右。預估雙方應該會是 45 對 55,而絕藝應該是遠高於我們,」吳毅成誠實地說。

令人沒有想到的,在第一天的賽事中,CGI 以全勝晉級,連團隊自己都不敢相信。到了第二天,比賽還在進行中,同在觀賽的紅面棋王周俊勛認為CGI有極高的機率獲得冠軍,因此就先傳了訊息向CGI團隊說:恭喜,得冠軍的機率很大。但「有點可惜,在比賽後期犯了一點錯誤」,無奈在 DeepZenGo 面前敗下陣,與冠軍擦身而過。

什麼是吳毅成口中的失誤?他解釋,電腦的邏輯跟人腦不一樣,電腦是只要贏就好,贏一目也是贏。但是,人類總是想攻城掠地,儘可能贏越多越好,人的邏輯沒有錯,贏越多就越能保障勝率,但風險也較大。

另外,進入比賽後期,如果電腦失誤,很容易就開始亂下。圍棋只要有一兩個地方看錯往往就會輸了,當 CGI 對弈 DeepZenGo 時,電腦搜索沒有那麼深,看錯了一個地方,但想要挽回時,才發現已經中了對手的陷阱,情勢已難挽救,團隊當場看勝率就往下掉了。

戰勝騰訊絕藝四關鍵

對戰絕藝的勝利,不僅讓外界注意到了 CGI,更好奇勝出關鍵是什麼。吳毅成笑說:「大家都在問這個問題,在會場時,就有很多人趕快拿我們的論文研究。」

目前,在圍棋智能程序領域,吳毅成分析,AlphaGo已經是在天上的等級,CGI、DeepZenGo、絕藝三者的實力是伯仲之間。蒙特卡洛樹搜索演算法(MCTS)發展後,DeepZenGo 一直領先,深度學習發展之後,他們也追得上,著實厲害。另外,大陸過去在 Computer Go(電腦圍棋)的投入不算多,但在 AlphaGo 興起後,投入大量資源及資金研發,一年就快速趕上。

「能打敗騰訊絕藝,主要是這次機器版本改善了許多小東西而累積起來的成果,使得勝率比之前版本多了 70~80%,我相信絕藝要改善是很快的。」不過他也對 DT 君透露了制勝的四個關鍵:

第一:機器過去只管輸跟贏,但這次網路設計是包括輸多少、贏多少,機率又是多少,例如比對手多五目的機率是多少、多六目又是多少。如果這一個 Net 可以判別可以輸幾目、贏幾目的話,在某個角度來看精準度就會更高。有些人可能認為這個對勝率提升幫助不大,但對 CGI 來說,數據是有提升的。

第二是分散式系統的成功,讓多台機器聯合作戰,也是此次加入的設計。

第三是改善了蒙特卡洛樹搜索演算法的一個項目。這個改善過去看不太出來,不過卻在這次展現。

第四則是訓練機器的棋譜,品質有所提高,包括有深層棋譜及高手棋譜。

另外,吳毅成也分享與騰訊絕藝、DeepZenGo 這些 AI 的觀察,一致認為有一個問題程序不好解,就是「龍」很長的時候程序常會誤判。這個對我們而言是個謎,我們也不確定 AlphaGo 是否已經解決,還是只是沒有遇到這狀況,因此讓人期待 DeepMind 的下篇論文。

投入圍棋前的練兵

吳毅成在 12 年前就開始將人工智慧應用在遊戲的領域,是因為當時他看到了一件事:電腦的運算能力已經夠了,摩爾定律快到極限, 讓他敢於投入,而且訂下一定要做圍棋的目標。不過,圍棋 AI 程序對他來說,就象是打怪遊戲里的大魔王,要挑戰它得先把基本功練好。

因此,實驗室先從其他的益智類遊戲做起。他在 2005 年發表了自創的六子棋遊戲,在其它遊戲也都取得很好的成績,包括麻將、暗棋、象棋等的競賽都取得冠軍。另外,在2048 數學方塊遊戲領域,他們也是全世界第一個達到總分 65536 的紀錄創始者。

把這些基礎建設好後,2015 年開始進軍圍棋。吳毅成的學生吳迪融進一步發展蒙特卡洛樹搜索演算法中的MM技術(maximization最大化、minimization最小化),成為他們開發圍棋AI程序的關鍵,「有了這個才敢發展 19 路」。

CGI 實驗室全力投入深度學習四五個月後,他們就在台灣區的比賽拿下冠軍。「當然,要到世界水準還有一段差距」。 之後學界開始出現利用深度學習預測高手下法的技術。而且盛傳 DeepMind 將在不久後展示相關突破。雖然當然有一派看法認為深度學習不一定能發揮很大的成效,但吳毅成非常篤定深度學習將颳起炫風。

儘管 CGI 的程度還不算好,但他跟學生說:「全力以赴,這是一個機會。我負責到處找資源,你們要做兩件事情:找 CP 值最高的 GPU,同時改善演算方法,減少 GPU 的需求。」到了 2016 年 DeepMind 的 AlphaGo 擊敗世界大師級冠軍李世乭,AI 從此在全世界流行起來。Android 之父 Andy Rubin 就認為,下一個操作系統會是 AI 平台,這無疑是新一波的技術轉移。

深度學習讓人為涉入減少

圖丨前微軟小娜(Cortana)研發總監杜奕瑾

對於這些評論,吳毅成認為是對也不對,當初 CGI 的目的就只是為了希望協助台灣棋手進一步提升實力。從學界的角度來看,「我們現在正是處於一個絕佳的時機」,有了深度學習之後,大家不是可以追得更快嗎?

對學校、學生來說,就算沒有贏過 AlphaGo,但過程就是一種學習,路走過了就會有收穫。「我們百分之百確信, DeepMind 不會一輩子做圍棋,就算他不玩了,後繼有人做更多的改善,都是件令人開心的事。」

確實,DeepMind 創始人兼 CEO Demis Hassabis 表示,他們相信 AI 協助社會發現新知識並造福社會的潛力,AlphaGo 讓人一窺此事的可能性,研發團隊將把精力投入新的挑戰,例如開發更高級的通用演算法,協助科學家們掌握各種更複雜的問題。

圖丨DeepMind 創始人兼 CEO Demis Hassabis

回顧 DeepMind 在去年做的幾件大事,還包括改善醫療,例如與英國國家醫療服務體系 NHS 旗下的基金會 Royal Free London 簽約合作,尋找疾病的治療方式,以及協助 Google 減少數據中心的能耗、語音辨識,或是發明革命性的新材料等。

另外,從創業的角度來看,中日韓的圍棋市場其實不小,但他也坦言,「這個東西只有第一名跟第二名可以活著」。不過,將這樣的概念應用在其他產業上也同樣是一種思路。

圖丨卡斯帕羅夫對戰深藍

「AlphaGo 跟過去 IBM 深藍不同,這次領域知識(domain knowledge)的人為涉入而減少了很多。」這是什麼意思?

幾年前,CGI 開發的象棋程序在大陸參加比賽,旁邊有一個高手觀賽到一半就直接告訴吳毅成:「你們輸了!因為這裡的卒距離對方的帥還不夠近,如果你再進一步就會贏。」但這對於沒有擁有像高手那樣超凡專業的開發者來說,就是看不出來,所以當時開發象棋,需要找一個很強的高手來告訴程序,這個局面有什麼特徵,是好還是不好,如果是好就加分。

吳毅成表示,換到現今的 AlphaGo 下圍棋,你會看到專業人士涉入的程度很少,一是因為圍棋複雜,走法、例子多到沒辦法窮舉。更重要的是,現在使用深度學習模擬人腦,是讓電腦自己學,而不是靠高手輸入指令。

「加上過去方式所要付出的成本很高,而且有些邏輯規則會互相矛盾抵觸,但現在深度學習厲害之處就是不再需要這麼多的領域知識( domain knowledge),同一套程序加以調整後就比較容易應用到其他領域,不論是遊戲、機器人、無人機都很有機會。」

或許也就因為如此,現在吳毅成的實驗室有一半學生都在跟產業界合作,包括機器人、光學檢測、製造應用等方面,未來都有發展成創業的可能。


點擊展開全文

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 DeepTech深科技 的精彩文章:

你以為你了解老鐵了?
AI做時裝設計師,夠fashion嗎?
細菌 微型太陽能板,只要一個桶就能進行光合作用!
特斯拉將推出長途運輸電動卡車,充電一次續航200到300英里
憑藉CPU與GPU分頭進擊高效能計算生態,AMD布局AI市場獲大客戶認可

TAG:DeepTech深科技 |

您可能感興趣

微軟在AI種黃瓜大賽中擊敗騰訊、英特爾奪冠
AI擊敗人類法律翻譯,前獵豹首席科學家為何跨界法律AI公司?
歐冠巴黎客勝曼聯 CBA上海爆冷擊敗廣東
羽毛球中國公開賽首冠出爐!印尼黑馬擊敗桃田賢斗奪冠爆最大冷門
琅琊榜2最強武功——烏金劍法!神似獨孤九劍,輕易擊敗荀飛盞!
擊敗湖人,雙殺雄鹿,掀翻五星勇士,NBA最大黑馬誕生了
海賊路飛VS將星卡塔庫栗,一招「大蛇」擊敗卡二贏得戰局
英媒:曼聯要簽巨星,已鎖定三大目標!巴薩將擊敗皇馬簽德甲神鋒
阿法狗後繼有人 谷歌新AI阿法星擊敗職業電競選手
大爆冷!擊敗澳網六冠王德約,韓國新星鄭泫成「亞洲之光」
中美韓三大機皇拍照對決:華為P20Pro擊敗蘋果三星
道路與方法之爭:為擊敗普京,俄羅斯兩大反對派領袖內杠
Dota2震中杯:ana無解劍聖擊敗秘密大魔王 拳擊手遭淘汰
拜仁擊敗本菲卡取歐冠開門紅 葡萄牙新星反戈舊主
龍珠英雄新篇章:復活扎馬斯的BOSS登場,目的是先擊敗大神官
擊敗冠亞軍!此隊已成德甲第一黑馬 2大神鋒統治射手榜
NBA快報+排名 威斯布魯克三雙雷霆擊敗馬刺排名互換 八人上雙熱火大勝奇才
文殊菩薩有何強大神通,能擊敗七大上仙中虯首仙?
官渡之戰曹操擊敗袁紹十大功臣:五大謀士和關羽榜上有名
又一個張本智和!超級大黑馬高調宣布目標:擊敗中國隊拿奧運金牌