Yann LeCun分享Facebook最新AI研發成果:AI變革的下一站是無監督學習
編輯 | 呂夢
微信 | ai_xingqiu
網址 | 51aistar.com
在今天的GMIC全球人工智慧領袖峰會上,Facebook人工智慧團隊首席科學家Yann LeCun通過遠程視頻連線的方式,帶來了《AI:最新研究成果,現階段局限性和未來發展趨勢》的主題演講。
在演講中,LeCun表示,「我們認為AI不僅僅會幫助我們解決問題,同時還會幫助我們解決很多人類自己無法解決的挑戰」。同時也指出,不管下次的變革在哪裡,都應該是無監督學習,並且在這樣的變革中出現一些常識性的學習。他在演講中提到兩點:
1.無監督學習是AI技術的未來;
2.用模擬器將會提高無監督學習的效率,這是大勢所趨。
上世紀80年代,LeCun讀博期間提出了「人工神經網路」,但後來該理論一度被認為過時,他本人甚至被拒絕參加學術會議,直到2013年,加入FacebookAI研究中心(FAIR),他的理論才慢慢開始變得熱門。
FAIR團隊專註於一個目標:創造跟人類具有同等智商的計算機。不斷提高計算機視、聽和獨立進行溝通的能力,並逐漸滲透到Facebook的各個產品中。
而在今年一月,LeCun宣布離開FAIR的管理崗位,並將轉任Facebook的首席AI科學家(Chief AI Scientist)。聲明中,LeCun表示將把重心移到AI科研以及AI戰略方向上。
以下為演講實錄(AI星球整理刪減):
我叫Yann LeCun,來自Facebook。人工智慧研究團隊是來自紐約大學,今天我想講一下關於深度學習的情況,同時也會講一下深度學習的未來,以及我們所面臨的關於深度學習方面的挑戰,如何讓機器變得更加智能。
今天的AI都需要去學習,涉及到深度學習,通過深度學習我們可以訓練機器,比如說向它展示一個車的圖像,它就會知道這是一輛車,下次向機器展示同一個圖像的話你就會得到想要的答案。所以,在這種指導下的學習對於計算機來說是非常重要的。
深度學習,比如科學培訓,機器進行端到端培訓可以讓機器完成某一項任務,它會告訴你最後的輸出是什麼。機器會學習整個過程,端到端的一個學習過程。通過這種方式計算,計算機會更好的了解我們的世界。比如像一個架構,可以看到實際上這個想法是可以回溯到上個世紀八十年代的時候。
它可識別圖像,同時也有很多其他的應用,比如說可以用於語言處理和語言識別和其他很多的應用。就是我們每天都在播的一些新的應用,特別是涉及到神經元網路這方面,關於人工神經智能方面,我們知道對於神經網路是非常大的。我只有在非常強大的計算機上才可以運用,需要有CPU加以輔助。
在深度學習變得比較普遍之前,我們需要確保這樣的一些系統可以用於這些情況,比如說其中的一個例子,是我們在2009年、2010年在紐約大學合作的一個實驗,可以看到它可以識別圖像,可以看出馬路上的建築、天空以及路上的車和人等等。但在當時,它並沒有稱為最好的系統。
在這裡大家可以看到在網路當中使用的幾個層,比如說有100層或者180層的一些人工神經網路。像在Facebook當中我們就會廣泛使用。因為有了這樣的一些應用,可以看到事物錯誤率是在不斷的下降。
這方面的故障率是在不斷下降的,有的時候表現的甚至要比人還要好。它的性能非常好,已經成為了一種標杆。另外它實際上比CPU識別圖像或者對象要更加複雜一些。它不僅僅能夠識別對象,同時能夠進行本地化處理。
這個是在Facebook人工智慧部門我們所做的研究,叫做Marsk RCNN,可以看到它的結果,它可以標記這樣的圖像,就像我剛才給大家展示的例子非常像的,展示出非常好的性能。
如果能夠展示這種的話,它不僅僅可以識別出每個人,同時它會為每個人加一個Marsk,所以可以很容易區分出是一個人還是一隻狗,在這裡大家可以看到它可以識別電腦、酒杯、人、桌子,都可以識別出來。而且也可以數出來到底有多少,而且也可以識別出道路、汽車。
所以可以看出這個系統,如果五年之前問系統這些問題的話,我們當時可能認為需要10-20年時間才能達到今天呈現的效果。這也是Facebook所做的一些研究,叫做Techaround。
大家可以下載上面的代碼,它可以探測200多種不同的類別,這也是Facebook在AI方面的一些研究,我們不僅僅發布了一些論文,同時連代碼也都發布出來了,這樣的話世界各地都可以更好的熟知這種技術。
當然還包括其他很多項目,在Facebook我們利用這樣的技術,我們可以預測人類的行為,不知道大家是不是能夠看得清這個視頻,我們現在有一個系統能夠實時的運行,在一個單一的GPU上運行。它可以跟蹤很多人的行為,生成視頻,而非常的準確。而且可以實時地生成一些相應的數據和信息,相應的代碼也是可以用的。這些都是一些最新的應用。是我們在AI方面所實現的一些新的技術,也是Facebook最新的研究。
當然利用的這樣的技術不僅僅可以進行識別圖像,可以進行面部識別,也可以識別人的行動,也可以使用計算機序列,也可以用來翻譯,這是Facebook在加州所做的研究。我們可以用我們系統進行翻譯的工作。Facebook經常使用,這樣的話可以把一些文字從一種語言翻譯到另外一種語言。
我覺得對於行業說進行這樣的開發研究將是會是一個非常有用的過程,對於我們研究團隊來說,不僅僅要開發,對我們公司來說非常有用的技術,同時我們也希望所開發的技術能夠引導整個社區,能夠解決我們所感興趣的問題。
我們認為,AI不僅僅會幫助我們解決問題,同時還會幫助我們解決很多人類自己無法解決的挑戰,所以我們會與我們的科學團隊一起朝這方面努力。這裡是在過去的幾年裡,所發布的一些開源項目,包括像深度學習網路,還有深度學習框架,這是關於深度學習的應用。
我剛才講到每天都會一些新的應用發布,也可以進行語言的翻譯甚至過濾,安全或者診斷,以及面部識別等等。另外在科學方面可以看到深度學習也廣泛的應用來進一步推動科學方面的研究。我們會看到在接下來幾年裡深度學習會發生更大的革命。
接下來為大家舉一個例子,這是應用視頻,我希望大家能看清這個視頻,它表現出來的是一種加速的過程,它可以訓練車去進行駕駛,而且可以調整車輪的方向。這樣的話可以讓車自己去進行駕駛,而不需要有人去進行校正。
接下來我們再來看一下差異化的編程。我們可以從另外一個角度來學習深度學習。實際上它也是一個固定的架構,它涉及到去進行編程,這個編程可以用人工神經網路解釋。這個編程一共有三個指數,它實際上和人工神經網路非常的類似,它會根據所展示的數據有所不同。
另外,根據數據系統也會有所變化。所以現在的問題是,我們是否有一種方法可以自動地生成一個自己的程序。同時可以對其進行培訓完成某一個具體的任務,這也就是我們所說的這個編程的想法。
現在人們已經開始在做一些深度學習方面的研究,比如說像基於網路,這些可以在Facebook進行這些深度的挖掘。我們通過研究可以實現這樣的一種編程,我們可以利用這樣的系統或者培訓系統,來完成某一個具體的任務。
這是幾年前所開展的工作,是由Facebook和紐約大學一起合作做的項目。這個項目是培訓,是去培訓Memory,能夠完成某一項任務,而且能夠回答相關的問題。在自然語言處理過程中,也可以看到人工神經網路是動態的在不斷變化的,因為它會決定人們將來會採用什麼樣的工具。
這是另外一個例子,也是關於動態的動抗和計算。如果你要建立一個系統能夠回答覆雜問題的話,比如說關於圖像的複雜問題,就好像最下面的圖像,大家看到它是同樣的尺寸或者像這兒展示出的是一個圖像,但是可能大家要問機器一個問題,是不是我們看到的這個黃色的立體,它要比別的多一些?
而在Facebook上我們有同樣的圖像,這裡的理念就在於我們在這兒輸入了一個問題,而且這個問題可能也有一些不同的代碼,它之後被解碼,而且之後會用於我們編程當中,就可以使的我們的系統進行回答。
對於這樣的編程,之後它總會成為圖片,所以為了回答是不是有一些更多的立體形狀,之後我們就會讓系統來進行計算。比如說這裡有多少是方形體,或者有多少顏色,最後告訴你具體的答案是什麼。通過這麼做我們可以建立起一個端到端的解答的途徑。而且也允許你提出更多新的問題。這些圖像都是動態的,之後你可以加以操作。當然了是根據你輸入的數據不同它有所變化。
大家看到這裡是我們最近開發所得到的一些深度學習最新的成就,之後我們來看一下關於AI有沒有我們觸及到的。因為對於新的技術我覺得我們可以進入到更多的領域當中,大家看到這裡我們可以進行更多影像的分析,比如關於醫學方面,我們還可以進行更多的翻譯,或者是有更多的其他的領域。在這個方面我們覺得對於機器,它可能確實是擁有一定的人工智慧,但是關於機器人分辨它有些功能,比如我們還需要更多的功能,比如像洗碗機之類這樣的功能我們都要探討。
有的人他們在這兒看到了,比如我們要來看一下關於在某些方面,比如說機器的學習方面,我們怎麼做呢?我們在這兒可以看到有一些具體的圖像,我們有些新的方法。
在實際的生活當中其實這種方式不太成功,因為關於深度學習方面我們要進行深入的挖掘,因為對於機器本身它會有不同的解決方案,比如在實際生活中是不能夠去實施的。有時候讓機器學習很長時間才能去玩遊戲。
可能要來進行100個小時,來進行這方面的學習才能夠做到。所以確實我覺得有些核心的功能方面,我們確實現在還沒有觸及到。因為這些機器是能夠做到的,但是我們還沒有挖掘出來。我們也可以對機器本身進行更深入的培訓。比如說我們要讓系統進行成千上萬次的培訓,之後它們才能夠進行學習。
有些學習它是力學方面的,但是在實際的生活當中不可能實時的來進行這些東西,所以我們只能夠進行模擬,但是它也需要我們進行很多的嘗試才能夠讓機器學到。對於嬰兒他們怎麼去學習呢?如果我們嬰兒展示的話,比如說就好像左下角的這幅圖像向他們展示的,可能他們不能夠得到支持,大概在六個月以下的嬰兒,他們可能不太了解比如物理方面的運動,可是他們在滿了八個月之後,對於嬰兒們我們覺得他們的能力非常的驚奇,因為他們已經知道了自由落體的作用了。
所以像下角的這個小女孩非常的了不起,我的一位朋友,她是在巴黎工作,她給我們展示出了對嬰兒他們怎麼學會一些概念,而且他們也能夠了解到一些物理最基本的原理。所以這是他們在生活當中最初學到的一些概念。
而這個也是人們的一些常識獲取的。對於嬰兒們他們就能夠了解到了背景的知識,他們所學會的是一些常識。另外我們在向動物展示這樣的情景,比如說大家看一下這個大猩猩,它們在幼年的時候由培訓員給它們進行一些展示,所以大家可以看到這裡大猩猩會覺得很有意思,面對這樣的魔術會笑出來,所以大家會把它們當做世界最起初的原型來看待。
但是我們希望機器能夠建立一些樣本,能夠使得我們系統進行運行,最終機器會得到學習,它之後來進行一些預測,什麼是可行的、會發生的,之後我們就可以使得機器像人一樣的有效的來進行運行。我們有這樣的監督或者學習,就能夠使得機器得到培訓,它們能夠來進行規劃,進行反映,這是我們需要它們建立起的一個系統。
不管下次的變革在哪個點,我覺得它們應該是無監督的學習,我覺得這樣的一個變革,它應該是自我監督或者無監督的一種學習。而且也會在這樣的變革當中出現一些常識性的學習。
我最後總結一下,這是我們最近做的一些非常有意義的事情,這是對於一些預測性的模型,來由機器進行規劃,根據它們的嘗試進行預測。所以這裡的理念在於我們有一些人工智慧的元素,它會對一個民眾社會進行預測,在它們實際參與,之前它們會預測有一些什麼樣的反映。所以大家會看到在整個的過程當中,它並不太多涉及到機器學習。我們認為在一個民眾社會當中我們希望機器應該基於自己的行動進行預測,之後得到一些模型,來進行設計。
關於具體的細節,有的人他們已經就這方面的培訓進行了工作,他們接受教育,比如機器在一些簡單情景當中怎麼來做。比如說我們對機器來看一下,有哪些物體有可能會跌落下來,有什麼樣的預測性,它的大概概率有多少,都可以使得機器做出一些預測。在最近的幾年當中大家非常的興奮,因為我們找到了一個的理念,現在我們對於問題要就它的確定性進行預測,我們要根據我們的輸入進行概率的培訓和預測。
我們通過對機器進行一些深入的學習,可以使得它預測一些結果。而且它可能會根據不同的場景,可能跌落,有可能不跌落等等,能夠對一些可能性結果進行預測。這裡的結果不僅僅是唯一正確的,可能有多種的結果。
大家看一下這個教授在進行培訓,其實我們進行了對抗性的培訓,比如說我們可以培訓每個分項是看起來不錯的,或者在實際的生活當中會發生什麼樣的結果。而且對於培訓者他也會告訴機器,在實際的社會當中又有什麼樣的結果。這麼做我們就能夠得到不同機器產生的結果,之後得到了很多的影像和圖片。
再回顧幾年之前,大家看到這是Facebook,在這幅圖上大家可能也相信,通過機器學習確實是奏效的。但是這裡有一些是虛假的圖像,之後大家由機器所得出來的這樣的圖像,它們看起來是真實的,但是其實只是一些虛像,一些幻景,所以我們現在也以我們的系統進行了培訓之後,產生出了一系列的人臉。
大家看到這是一些名人他們的面孔,大家看到它逐一的排列出來,而且我們在下周會議上會向大家展示最新的結果,得到的成果非常的好。總之,我們希望把這個工具之後能夠融入到我們機器學習當中。
下面我給大家舉幾個例子,如何來幫助我們進行預測。這樣的預測是由我們機器深入學習展示的,有幾幀的視頻給大家展示一下,因為針對不同的情境我們給大家展示出如何來進行預測。
比如說這裡是一個人行道,我們看到人們在穿過這樣的人行道,而且關於其中的預測是由人工智慧所展示的,我們可以進行監督的學習,看一下這個機器在今後幾年是不是能夠得到很好的進展。
最後我想做一下總結,我覺得在我們當中接下來最新的趨勢應該是關於監督學習方面,我覺得它可能是不能夠被替代的。不管是無監督的學習還是其他的學習方式都不能夠替代。所以這點已經引起了很多人的興趣,就是接下來幾年還會持續的發展。我相信這也會使得我們進行不斷的更多的實施。我們也要根據更多的嘗試。
還有一點我也不斷的重複給大家,這就是說我們要使得機器能夠推理,來看一下深入學習能給我們什麼樣的推理能力,也要來回顧一下在AI的時代機器它的推理能力有多高,它的邏輯性有多強。
接下來我相信我們會不斷的進行演變,而且我們也要來朝著可差異化的智能學習的方向持續的發展,這就需要我們來進行對抗性訓練更多的研究。
當然了,還會出現更多的有關深度學習的變革,比如說包括了有一些多渠道的發展或者是複雜的架構,而且會出現更多的理論,在這個領域會不斷的出現。
關於技術的趨勢是這樣的,很顯然接下來的監督會不斷的弱化,甚至監督會消失,這就使得我們出現一些新的理論的產生,比如新的語言,或者是出現了一些並行的文本,我相信之後應該有多維度的可能性。
我們會發現出現一些新的框架,也包括了一些動態的影像或者是更多的幻象。而且我們詮釋的能力會不斷的提升,我們和微軟,和亞馬遜會進行更多的合作;我們也會不斷的來開源。當然了,現在我們的工作量很大,但是關於我們的移動工具和其他工具變得越來越流行了,Facebook的用戶他們已經是每天能夠推出大概20億個不同的影像,所以我覺得之後可能大家出於不同的目的他們去參與,我們希望能夠充分發揮這方面的力量,它可能是一種很強的驅動的能力。
另外,這也使得我們要不斷的強化硬體,以便使得用戶的需求能夠得到專業化的處理。這裡我感謝各位的傾聽,謝謝!
如果你想了解最前沿的AI技術和場景應用
一網打盡AI界前瞻科技和深度報道
如果你想持續拉升逼格
歡迎關注AI星球,並轉發朋友圈為我們打Call哦~~
你們的支持才是我們創造優質內容的不竭動力~送你花花


※有人做醫療助手,有人造「AI玩具」,警惕AI醫療搞泡沫
※英美智能音箱市場將暴增,而中國市場卻有三大限制
TAG:AI星球 |