當前位置:
首頁 > 新聞 > Google Brain陳智峰:尋找外行星、保護動物……沒有什麼是TensorFlow不能做的

Google Brain陳智峰:尋找外行星、保護動物……沒有什麼是TensorFlow不能做的

Google Brain陳智峰:尋找外行星、保護動物……沒有什麼是TensorFlow不能做的

今日,極客公園創新大會 IF 2018 在北京召開,Google Brain 首席工程師陳智峰分享了《尋找答案從定義問題開始——TensorFlow 可以用來做什麼?》的演講。

演講中,雷鋒網發現他展示了一張谷歌搜索圖,其中顯示過去的 7-8 年,人們對深度學習的搜索量增長了大約有 100 倍,不管是學術界還是工業界,對深度學習的關注度近幾年有了快速的增長。於是,谷歌在 2015 年 10 宣布開源 TensorFlow,如今這也成為目前較完整的深度學習軟體開發平台。

那麼,這個平台到底能為谷歌和其他開發者做什麼?近兩年它又有哪些進展?除此之外,雷鋒網更想知道 Goolge Brain 整個團隊正在做哪些研發?雷鋒網將其演講全文整理如下。

深度學習的演變過程

深度學習這幾年非常流行,在這張圖上,大家可以看到在Google的搜索流量裡面,深度學習在過去的7-8年時間裡面,增長了大概100倍,從這個側面也反映出學界和工業界對這個技術的關注程度,是在迅速的提高。大家都想知道,深度學習是什麼,它能夠為我們做什麼?我如何把這個技術應用到實際場景當中去。

其實,深度學習並不是一個突然出現的技術領域,核心演算法就是神經網路,神經網路是一種機器學習的模型,這個模型主要特點就是,它可以擬合任何數學上的函數,特別是利用大數據反覆迭代的一種,類似於方法來訓練好這個模型。

隨著大數據的普及,計算機硬體算力的發展,還有演算法本身的突破,大家突然發現,這個以神經網路模型為核心的深度學習技術,在很多應用領域都可以大大的提高過去軟體系統需要完成的任務,最經典的應用領域大家肯定很熟悉,就是圖像識別領域,自2012年以來,在這個領域,自動圖象識別的錯誤率從20%一直持續下降到4%點多,已經超過了一個普通人分辨的圖像的能力。

Google在好多年前就已經開始把深度學習的技術應用到它很多產品當中,在這個過程當中,我們也迭代、開發了好幾代支持深度學習的軟體系統,最終導致我們在2015年10月開源了TensorFlow,藉此希望能夠進一步推動深度學習的應用和研究。

TensorFlow 是什麼?

TensorFlow現在已經演化成一個相當完整的深度學習軟體開放平台,比如說,它支持CPU、GPU混合搭建的數據中心的訓練平台,它也支持將數據中心訓練出來的好的模型,相對便捷的部署到不同的移動端應用上,可以支持類似Google自主研發的特別定製的TPU處理器,這種多平台的支持,我們覺得可以幫助到最多的用戶和應用場景,我們同時也非常感謝很多業界的同行對我們的支持,比如說在美國Intel和英偉達都在幫助我們優化TensorFlow在他們各自硬體上的性能。

支持多種硬體的平台是基礎,TensorFlow一直以來的一個目標,就是能夠幫助盡量多的開發者,能夠把深度學習的技術利用起來,最終使得廣大的用戶從中能力得到益處,基於這個想法,TensorFlow一直很重視多種程序員開發環境的支持。比如說,開發者可以在主要的開發環境中使用TensorFlow。

TensorFlow 能做哪些事情?

TensorFlow在我們公司內部的應用推廣是非常全面和徹底的,比如說TensorFlow很早就幫助Google的核心業務(搜索和廣告),實施了深度學習的模型,並且在核心業務上體現了他們的性能。

在垃圾郵件過濾也使用了TensorFlow訓練的模型,同時在安卓的應用程序推薦上,也上線了TensorFlow的模型等等。很多TensorFlow應用都是發生後台,大多數用戶可能沒有直接的體驗,這裡我舉幾個在移動端的例子來說明深度學習,其實已經很直接的影響了成千上萬的用戶。

自拍虛化

比如說,安卓手機最近的版本當中增加了一個自拍功能,這個自拍功能就是通過應用深度學習訓練出來的視覺模型,可以非常準確的分離前景像素和後景像素,對前景像素和後景像素分別處理,這樣的話就可以實現背景虛化這樣的功能。

實現這種功能,傳統上,手機廠商需要增加第二個攝像頭,這就會增加手機的成本,同時對現有用戶已經獲得的手機就不太容易獲得這樣的效果,通過新的演算法,可以實現一些過去可能非常昂貴才能實現的效果。

語音處理

和圖像處理一樣,語音處理是另一個被深度學習深刻改變的領域,語音識別要比圖像處理更早的採用神經網路,產品方面,這些年智能音箱語音主力大行其道,其中一個很大的原因就是深度學習演算法把語音識別和語音生成的技術門檻大大地降低了,過去可能需要20—50個博士的團隊才能完成的任務,現在就下載一個現有模型定製一下,就可以達到同樣的效果。通用的機器學習框架,可以幫助到更多的開發人員,開發出適合自己特定應用場景的語音應用。

另外一個例子,機器翻譯現在你可以用手機拍一張照片,手機軟體可以自動的識別出圖形中的文字,把文字翻譯成另外一種語音,看似簡單的應用,其實是圖像技術和機器翻譯技術很自然的結合。

我很有幸一年多前參與了谷歌內部,把過去的翻譯系統升級為神經網路為基礎的系統,我們從這些圖像可以看到,那次升級極大的降低了機器翻譯的錯誤率,一些語言之間的翻譯,幾乎可以達到人工翻譯的效果。

其他應用

利用深度學習技術,我們不僅可以大幅度的提高已有產品的功能和性能,我們還開發了一些過去很難想像的新功能,比如說郵件自動回復的功能,安卓上的郵箱軟體可以分析用戶的郵件,比如說你今天早上收到一份你朋友發的郵件,晚上是不是要到哪裡吃飯,大多數情況只有三種可能的回答,比如說我會準時到或者是對不起我沒有空不能來,或者是我有空,但是我可能需要晚一點到。我們現在郵箱會自動地給你提供三個選擇,這樣的話在路上看到郵箱,只要一鍵就可以完成郵件的恢復,極大的方便了用戶在手機上處理郵件的效率。

TensorFlow 在其他領域的應用

通過前面我講的很多應用例子,我們可以看到一個通用的深度學習框架,可以幫助到現有很多互聯網上的應用提高他的智能水平,但是我們也可以看到,TensorFlow這樣深度學習的框架,在其他許多領域也可以得到領域,比如說我們在倫敦的同事,過去兩年努力推進AlphaGo在工作就非常得益於TensorFlow框架本身的幫助,因為TensorFlow在利用超大計算機集群和最新加速器方面的支持,AlphaGo的團隊可以更加專註於演算法的研究。

我們組也有人在做智能醫療工作方面,由於TensorFlow是一個通用的框架,他們可以很方便的重用現在已有的圖像識別模型或者是自然語言處理的模型,針對特定的應用領域和數據,重新訓練微調一下你的模型,就可以達到在檢測視網膜病變任務上面超過95%的準確率,這個準確率已經超過了普通眼科專家91%的準確率。

在自動駕駛方面,我們在Alpha Waymo的同事,也在利用TensorFlow不斷改進他們自動駕駛系統當中的深度模型,包括對路況場景的分割、雷達信號的處理等等。

我們特別欣慰的是通過把TensorFlow開源,我們真的利用深度學習技術的門檻大大降低了,過去兩年我們看到很多和互聯網毫無相關的行業,也開始嘗試利用深度學習的技術和方法,比如說這家公司是一個嬰兒食品製作的公司,引進了TensorFlow訓練好的智能系統,這個智能系統可以把嬰兒食品的原料進行分類,把一些爛掉的蘋果和香蕉更準確的排除出去,這樣可以大大準確的控制嬰兒食品的質量。

我們也很興奮的看到TensorFlow在計算機科學以外的科學研究上,也得到了使用,比如說上個月美國航天總署宣布一項研究成果,美國航天總署有個開普勒計劃,他們的科學家和我們的同事聯合開發了一個TensorFlow的模型,開普勒計劃本身的目標是通過在望遠鏡持續不斷地觀察太空中恆星亮度的變化,希望發現太陽系以外的行星系統,最終希望發現另外一個適宜人類居住的行星。目前該計劃已經積累了上百億個觀察數據,幾個月前這個TensorFlow的模型,幫助科學家發現了2500光年以外的開普勒90星系中發現了第八顆行星。

人們不僅仰望星空,同時我們在回望我們的地球,在這個應用的例子裡面,澳大利亞的科學家用TensorFlow開發的圖像識別模型,在數萬張海洋航拍圖照片中,可以快速並且準確的找到需要保護的大型海洋哺乳類動物,比如說可愛的動物,就是澳大利亞附近的珍惜動物海牛。類似也有科學家,利用TensorFlow把語音處理技術用到鳥類保護上,他們在叢林里安裝了很多話筒,採集鳥類的聲音,模型就可以很準確的估算出鳥類在一片森林中的數量,從而可以更加精準地對他們實行保護。

我們組還有同事進行一些非常有意思的應用,他們正在嘗試利用深度學習的技術來創造音樂,很有意思的是,這些音樂創作的樂曲,還受到了專業DJ的肯定。

跟國內公司的合作

TensorFlow自2015年開源以來,我們一直在努力投入,最近我們開始加大力度對中國市場的支持,比如說我們正在建立一個TensorFlow的中文網站,TensorFlow的開發者也實現了快速的增長,同時,我們也看到超過1000多人參與了TensorFlow的開發,這是一個非常活躍的社區。

另外,我們的數據也顯示,到目前全球180多個國家,各種用戶已經下載了超過1000萬次的TensorFlow開發包,這表明TensorFlow的應用開發也是非常普遍的。

前在中國有大量的開發人員在持續的關注TensorFlow,事實上,我們在自己和眾多的中國公司建立夥伴關係,積極的支持和幫助他們更好的使用TensorFlow。

比如說京東內部搭建了TensorFlow訓練平台,用於開發圖像、自然語言相關的模型,並且把他們用到客服廣告等領域。小米也在嘗試類似的技術路線,支持他們生態線上各種特殊的應用。網易的有道筆記、網易翻譯君也使用了TensorFlow視覺和語言的模型。

非常感謝我們的用戶和合作夥伴對TensorFlow的反饋,TensorFlow也正在努力開發新的功能,在去年我們開發了TensorFlow一個模式,這個模式希望能夠更加有利於前端的開發,便於調試,支持更多動態的變成模式。

在這裡可以右邊有一個很簡短的程序,在這個程序中,大家應該能夠看出一個模式最主要的特徵就是在前端的程序流程中,可以更加直接的反映程序演算法邏輯本身的流程,這一點我們相信會特別有助於快速原形的開發和調試。

另外,TensorFlow在過去一年中主要推進的項目是TensorFlow Lite模式,這個模式是專門針對移動和嵌入式應用場景打造的機器學習平台,它的目標是希望把部署機器學習在雲端訓練的模型,更加簡單、高效的遷移到移動端上進行部署。

最後,我們也在開發新一代深度學習硬體加速器TPU,去年我們宣布了第二代處理器,這個處理器可以達到180萬億次浮點運算的性能,有64千兆的內存,如果我們把這樣的處理器集成在一起,搭建一個集群,這個集群我們估算到,可以非常容易排到世界上超級計算機的前五名。

目前我們正在內部各種產品研發中使用TPU二代,並且有計劃在不久的將來開放給公眾使用。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

TAG:雷鋒網 |