當前位置:
首頁 > 最新 > 湯曉鷗與MIT、賓大教授共話AI:熱潮終將退去,人工智慧的中國式文藝復興

湯曉鷗與MIT、賓大教授共話AI:熱潮終將退去,人工智慧的中國式文藝復興

大數據文摘作品,記者:龍牧雪

「《前任3》票房賺了18億,那是一個前任6億啊!」

香港中文大學信息工程系教授、商湯科技聯合創始人湯曉鷗昨天在《麻省理工科技評論》與DeepTech深科技主辦的新興科技峰會EmTech China上,保持了「被科研耽誤的段子手」的特性,如此調侃道。

你沒進錯場,湯曉鷗演講的主題是人工智慧,不是娛樂新聞。但是他的演講自帶段子手屬性,還兩次曬了自家娃,引發全場爆笑,簡直讓文摘菌回憶起了自己養蛙時候的心情。

下面,文摘菌就帶大家回顧一下湯曉鷗的演講全程,以及之後的圓桌討論環節。參與28日上午峰會的,還有從事自然語言處理研究的賓夕法尼亞大學計算機與信息科學系教授Dan Roth和從事計算機視覺研究的MIT腦與認知科學系和人工智慧實驗室教授Tomaso Poggio,大家可以往後翻查看他們的演講PPT。

湯曉鷗:人工智慧的中國式文藝復興

Ladies and Gentlemen, I will conduct my entire talk in Chinese, in 東北 Chinese.

一上台,湯曉鷗首先表示,自己將用東北口音普通話完成演講

今天我講的題目是《人工智慧的中國式文藝復興》,這個題目我在上海講過一次,我這個人不太喜歡重複自己,於是我又想了一個新的題目,叫《人工智慧的中國式十月革命》。

人工智慧的熱潮終究還是會過去的,過去完了以後是什麼呢?有的人告訴我是區塊鏈。

如果說人工智慧=大躍進,大躍進之後是三年自然災害,那麼區塊鏈=三年自然災害。

言歸正傳,我每次演講,都是從這張照片開始。有兩個原因,第一,這是我兒子;第二,他長得漂亮。

言歸正傳地曬娃

今天又多了一個更名正言順的原因:在座有很多MIT的教授,我兒子再過四、五年就要申請大學了,我想提前讓教授們認識一下我兒子,幫助他將來申請。我想我長這樣都可以進MIT, 他這麼帥,應該沒問題。雖然他學習成績很一般,而且不是一般的一般。

再一次言歸正傳,我想大部分中國人都應該知道這部電影——《戰狼》。

一下子賺了56億票房,約8.8億美金。這在15、20年前是不可能的;那時候中國的一部電影是不會賺這麼多錢的。這有很多原因,其中一個非常重要的原因就是今天我們都願意花錢去電影院看電影了,而15年前、20年前,很多人會去買盜版的VCD,或者去網上下載一個盜版。如果這樣,導演和演員也就沒有動力再繼續堅持下去了。今天中國電影的成果最重要的推動力就是我們對原創和版權的尊重。

我們現在不是只有一部電影這樣成功,比如《羞羞的鐵拳》賺了22億,《芳華》是一部文藝片,也能達到14億的票房,當然,馮導的電影從來沒有讓人失望過。

《前任3》的票房是18億,平均下來,每個前任6億啊!

《無問西東》是一部非常有情懷的文藝片,也做到了5億票房。都非常不容易。所以,對原創的尊重使得中國的原創電影不斷往前發展。

在三四十年代,全球電影發展起來時,中國電影並不落後,像《馬路天使》、《一江春水向東流》一點也不輸給好萊塢電影。即使在那個戰火連天的年代,中國還能夠拍出這些好電影,一個原因可能也是當時沒有DVD和互聯網來幫助盜版。

再往前,說一下文藝復興的時候,如果米開朗基羅的這些作品,或者任何一個藝術品很快有人進行複製了拿去賣,那麼他可能也賺不到什麼錢,也就活不下去了。所以,對於原創的尊重也是文藝復興能真正興起的一個原因吧。

我在最後放了一個現代藝術品,我覺得和米開朗琪羅的《大衛》有異曲同工之妙,是用手紙做的一個彈琴的藝術家。這個也是給MIT教授看的,因為這個是我兒子做的。(曬娃乘以二!)

說到原創,下面我們來講講人工智慧。

一提到人工智慧,大家腦海里第一個想到的公司是哪一家呢?我看到大家都在點頭,應該大家都同意,第一個想到的一定是商湯。(觀眾爆笑)

花式曬公司

我覺得大家這個笑就很不禮貌了。OK,是谷歌。

但是我相信人工智慧這個熱潮一定會過去的,等這個熱潮過去了以後,商湯一定會成為人工智慧最頂級的公司。

那為什麼是谷歌?因為谷歌真的把資金投入人工智慧發展,2015年的研發經費就是120億美金。2014年有一家公司叫DeepMind,只有12個員工,沒有賺錢,只是在用深度學習玩遊戲和下棋,但是谷歌就花了6.6億美金收購了這家公司。如果是在中國,大家就會花幾百萬美金把人一個個挖過來,那要便宜得多。但是如果那樣做的話,就是對公司、對原創的不尊重,就不會有後來的AlphaGo了。大家也就不會坐在這兒對人工智慧產生這麼大的興趣。AlphaGo真的是開創了這個時代。

那麼AlphaGo之後大家還能做點什麼呢?谷歌又做了AlphaGo 2(AlphaGo Zero),有些公司開始學著AlphaGo下圍棋,還有的公司選擇打撲克牌,這從某種意義上講,都是跟在別人的後面做事情。

真正有意義的事情是,在AlphaGo之前你做了什麼?有沒有做什麼事情讓機器在某項任務上戰勝人類。在AlphaGo之前我們做了一件事情,2014年,我們團隊從事人臉識別,在全球第一次讓機器的人臉識別能力超過了人的眼睛,像AlphaGo一樣,在某一個人類定義的單項任務上,機器超越了人類。超越了人類就過了一條紅線,而過了這條紅線就可以在工業上進行應用了。

但是在真正應用的時候,又發現了很多問題,過了紅線還是不夠用的,從實驗室到大規模產業化還有很長的路要走。

2014年,我們用20萬人臉來對機器進行訓練做到了98.5%的準確率,而人是97.5%;2015年我們用30萬人臉進行訓練,達到了99.55%的準確率。但是這個準確率還是不夠。如果用上億人來建模,還是會有非常多的誤報。所以我們從實驗室進入了工業化時代。

2016年,我們用6000萬人臉訓練,達到了百萬分之一的誤識率;2017年,我們用20億人臉訓練可以達到一億分之一的誤識率,而這樣的誤識率才可以真正地應用到各行各業,包括監控、金融、安防、手機等行業。所以,我們和高通簽署了全球AI戰略合作協議。

那麼除了人臉識別,我們現在還做什麼?我從我們做的十幾個行業里選出一個來簡單介紹一下——視頻分析。

下面這個技術是行為檢測。

這是里約奧運會的跳水比賽直播,大家可以看到過了9分鐘也沒有看到跳水的內容,要花一大堆時間看一些枯燥的內容介紹。所以,我們用計算機視覺分析的方法,可以從很長的一段視頻里把重點內容檢測出來,你就可以直接跳過沒有意義的部分,直接看這些有趣的、真正的跳水的鏡頭。

下面這個演示是基於內容的視頻搜索。

在電影中,我們可以把各種各樣的片段搜索出來,比如說你想搜索武打動作片段,或者喜劇片段,我們可以直接把它搜索出來,或者你想搜索科幻的,我們可以把科幻的片段搜索出來。

下面這個演示是用自然語言描述來進行場景搜索。

我們用自然語言來描述一個電影中的場景,然後它就可以自動根據你的描述把這個電影片段搜索出來,比如,我們要搜house of cards中的一個片段,「Claire和Frank坐在藍色沙發上」,大家看到下面這段場景就出來了。

另外我們不但能把視頻分析出來,還能理解這個視頻,然後用自然語言描述出來。比如下面這些運動視頻,機器可以像解說員一樣來描述運動場上發生的事情。

上世紀的一部電影《美國往事》是在威尼斯的Lido酒店拍攝的,下面這個演示里,我們能把電影場景里的所有物體都檢測出來。

不僅僅檢測演員是哪一個演員,他穿的是什麼衣服。這個場景是在餐廳里,所有的桌子、花、椅子全部能夠實時的自動檢測出來。這樣的技術在以前是非常難的,但是現在我們都可以做到了。

再回頭來看我們如何用這些技術來分析前面提到的電影《戰狼》和《羞羞的鐵拳》,我們通過分析這些演員的動作和他們之間的關係,可以分析出來在不同的場景之下,這兩個演員是誰,在做什麼,這個片段是什麼類的情節。

同時,我們可以給每一幀情節分類,可以識別出每一個鏡頭是打鬥場景還是戀愛場景。我們也可以把一個電影最精彩的鏡頭提取出來,大家可以挑選比如動作的精彩鏡頭、感情戲的精彩鏡頭、悲劇的精彩鏡頭等等。

那麼總結起來,我們在做什麼呢?

我們是在教機器看電影。我們的目的是讓機器代替人類看電影。

一開始我們是教機器來識別人臉,Google是在教機器來下圍棋,而現在我們來教機器代替人看電影。這個感覺有點怪,我們讓機器來做下棋,看電影,玩遊戲這些有趣的事情,然後我們人類只負責給機器充充電,維修和保養。我想未來可能就是這樣的啊。

我覺得大家聽了這個一定覺得很可笑。實際上所有的任務,都是我們人安排給機器做的,機器是按照我們的指令在做事情,不存在機器控制人類這樣的事情,AI的真正目的是幫助人類,幫助我們提高生產效率。

最後給年輕人留下兩句話:

第一句,電影一定要自己親自去看。

第二句,AI這個詞在中國拼音翻譯過來就是「愛」,所以談戀愛也要自己親自去談,否則你就不止是「前任3」了,很有可能是「前任4」、「前任5」了。

湯曉鷗,香港中文大學信息工程系教授、工程學院副院長,IEEE Fellow。他1990年本科畢業於中國科學技術大學,1991年獲得羅徹斯特大學碩士學位,1996年獲得麻省理工學院MIT博士學位。2005年至2008年,他在微軟亞洲研究院擔任視覺計算組主任。

當年湯曉鷗和何愷明(目前在Facebook AI實驗室FAIR工作)、孫劍(前微軟亞研院首席研究員、現任曠視Face++首席科學家)合作的去霧演算法論文Single Image Haze Removal Using Dark Channel Prior在2009年IEEE計算機視覺和模式識別(CVPR)會議上獲得最佳論文獎。(關於何愷明的最新動態,可以看看這篇:《如何評價何愷明大神斬獲ICCV 2017最佳論文》)

湯曉鷗與MIT、賓大教授共話AI

在圓桌環節三位大咖的思維碰撞中,湯曉鷗、Dan Roth、Tomaso Poggio三位教授都提到在中國發展人工智慧有諸多良好條件,包括高層有工科背景、大數據方面法律寬鬆、有大量學生等。

Tomaso Poggio(左二)、Dan Roth(左三)、湯曉鷗(左四)

Dan Roth從自然語言處理的角度出發,提到人工智慧目前發展的瓶頸有兩點:有沒有足夠數據,和能否給出合理解釋。

湯曉鷗補充說,「We know how it succeeds, but we don"t know when it will fail」 。可解釋性在醫療領域的研究中尤為重要。

Tomaso Poggio從計算機視覺和腦神經科學的角度補充說,人類嬰兒在學習時,不會需要上百萬的圖片來認識什麼是貓、什麼是狗。人腦科學非常複雜,人工智慧需要方方面面的解決方案。機器要能擁有和人一樣的智能程度(能解決多方面問題而不僅僅是單一問題),還需要進行很多研究。現有人工智慧商業化應用非常良性,而要取得進步,在研究方面的投入和商業化一樣重要。"There is science to be made, not just technology"。

最後,湯曉鷗給出了對想進入人工智慧領域的學生的建議:

「如果你5年前想進入AI領域,那很好。但是現在進入AI領域,你會發現5年後,所有人都在做AI,你甚至找不到工作。Follow your heart, never follow anyone else.「

文摘菌覺得,這就是「聽從你心,無問西東」的另一個解釋吧。

說到人工智慧的目前進展,可以看看現場的實時翻譯效果


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 36氪 的精彩文章:

傢具賣場那麼多,為什麼說是宜家改變我們的生活?

TAG:36氪 |