當前位置:
首頁 > 最新 > 別光盯著全球最大GPU!GTC 2018最全回顧,看這篇就夠了

別光盯著全球最大GPU!GTC 2018最全回顧,看這篇就夠了

作者|Vincent、Natalie

AI 前線導讀:北京時間凌晨 0:00,大洋彼岸的美國加州聖何塞會議中心,被稱為英偉達技術盛宴的 GTC 2018 大會正如火如荼的進行著。作為英偉達 2018 的開年大戲,黃教主再次做足了準備(當然黑色皮夾克不算 (~ ̄▽ ̄)~)新一輪的「核彈」轟炸已經開始,沒時間解釋了,快上車!

更多乾貨內容請關注微信公眾號「AI 前線」,(ID:ai-front)

GPU 家族再添重磅「新丁」

在本屆 GTC 大會開始之前,國外媒體就已經開始盛傳:黃仁勛將在 GTC 2018 上發布一款 GPU 家族的新品,這次 GTC 大會「有一定可能」會成為英偉達同時發布 GPU 硬體種類最多的一次。此外,目前活躍在外媒爆料中的新架構代號,已經有 Ampere(安培)、Turing(圖靈)兩個。

就在發布會開始前幾個小時,外媒又突然曝出小道消息稱:

與之前的傳聞和報道相反,Nvidia 可能會在 GPU 技術大會(GTC)上為我們帶來下一代遊戲顯卡。據報導和傳聞稱,下一代 Nvidia 顯卡被稱為 GTX 20 系列。

雖然是小道消息,但是根據近三年來 GTC 上新品的發布情況看,也不無道理。

GTC 2015 上,英偉達發布旗艦顯卡 TITAN-X、Pascal 架構的路線圖,同時,黃仁勛在現場和埃隆·馬斯克大談自動駕駛;

到了 GTC 2016,英偉達發布全新的 P100 GPU、更新自動駕駛的進展以及對於深度學習方面的大力投入;

去年的 GTC 2017 上,英偉達再次放出「核彈」,發布了全新的 Volta 架構 GPU Tesla V100、同時發布 GPU Cloud、虛擬機器人產品 Project Holodeck 以及主要針對自動駕駛的輕量化平台 Xavier DLA。

然而,小道消息終歸還是小道,發布會開始之後,黃教主親自出來用產品破除謠言。

小「核彈」——Quadro GV100

黃教主登場了,還是熟悉的黑色皮夾克,還是很激動:今天又有很多新的東西要帶給全世界。

作為一個做顯卡起家的公司,黃仁勛說,幾十年來,計算機科學家們一直在重新創建逼真的圖像。光線跟蹤跟蹤每一個光子在場景中的反彈,基於它撞擊的材料。電影業就是這樣做的,它需要數以千計的 CPU 來完成這件工作。一個 CPU 需要幾個小時來計算一幀,而電影中有數十萬幀。過去四十年來,我們一直在努力縮小差距,以創造一部完整的電影。

隨後大屏幕上展示了一段來自《最後的絕地武士》的電影場景,是一群正在聊天的風暴騎兵,黃教主說,這實際上是用光線跟蹤進行實時渲染的。

黃教主隨後說到:「現在我們可以把實時光線跟蹤推向市場了。該技術已封裝成多層。正因為深入學習取得的成果,我們可以預測光線,所以我們才能追蹤所有光線。」

於是,按照慣例,黃老闆又「隨手」掏出了一塊「核彈」——Quadro GV100。

黃老闆展示新產品

Quadro GV100 是世界上第一個基於 Volta 架構的工作站 GPU。它擁有一個稱為 NVLink 2 的新互連,可以將編程和內存模型從 GPU 擴展到另一個 GPU,使它們基本如同一個 GPU 一樣工作。這兩個處理器加起來有 10,000 個 CUDA 核心,236 萬億次 teraflops,所有這些都是用來革新現代計算機圖形 or 顯卡,擁有 64GB 的內存。

接著,黃教主又說出了那句經典的話:「The more GPUs you buy,the more money you save!(你買的 GPU 越多,你省的就越多)

每年有至少 400 個電子遊戲會被製造出來,他們使用光線跟蹤提前渲染整個遊戲。最終玩家看到了奇妙的陰影和細節,整個世界都變得如現實一般。電影業每年在 500 部電影中使用這種方法,每一幀都要渲染多次。想像一下,如果一個 CPU 花幾個小時處理一個幀,這需要多長時間。而有了 Quadro,實時渲染成本降低了 1 / 5,佔用空間減少了 1 / 7,功耗減少了 1 / 17。

「Come to GTC,learn how to save millions of dollars!(來參加 GTC,老黃教你節省百萬美金)」黃仁勛補充說。

醫療影像超級計算機:CLARA

接著,黃教主說,今天的第二個重頭戲,就是英偉達在 AI 醫療領域的進展。

Clara,英偉達推出的一款醫療影像超級計算機,一個虛擬化數據中心:遠程、多模式、多用戶。

為了展示 Clara 的強大,黃教主連線了場外的同事,進行了一番演示:

通過 Clara,可以看到灰色像素和一個美麗的渲染胎兒之間的區別,後者還有清晰準確的膚色。這項技術被廣泛應用於 CT、核磁共振、寵物掃描等領域。

真的是「核彈」!世界上最大的 GPU

老黃舉了個例子:AlexNet 一個處於領先地位的神經網路,五年來多次贏得了 ImageNet 競賽,它已經催生了數千個人工智慧網路。最初的 AlexNet 有 8 層和數百萬個參數,現在已經是數百層具有數十億個參數。五年內增長了 500 倍。摩爾定律只預測到 10 倍。

教主稱之為神經網路的寒武紀爆炸(Cambrian Explosion)——卷積網路、循環網路、生成對抗網路和強化網路。

因此,「世界不需要大的 GPU,不需要很大的 GPU,世界需要一個巨大的 GPU。

大概這麼大就足夠了!

於是,黃仁勛說到: 「今天,我宣布推出世界上最大的 GPU—它相當於 16 個 Volta,由 12 個新的 NVSwitches 連接起來的。它創建了相當於 512 千兆位元組的內存。定址內存的方式使用相同的軟體。總計每秒 14tb 的聚合帶寬。1,440 部影片可以在一秒鐘內通過這個 Switch 傳輸。總共擁有 81,900 個 CUDA 內核,2petaflops。現有世界上最快的超級計算機是 125petaflop,美國最快的是 100petaflop。而光這一塊 GPU 就有 2petaflop。」

黃教主這樣形容:「它太漂亮了,太性感了!」

這款 NVIDIA 創造的,目前世界上最大的顯卡名為DGX - 2

它的處理能力是 2017 年 9 月發布的 DGX - 1 的 10 倍,隨著我們對人工智慧的不斷探索,神經網路的層數越來越多,對不同框架中訓練速率要求越來越高,我們需要更大的神經網路,做更多的實驗,DGX - 2 的出現恰好是最好的時機。

這台耗費了數億美金打造的世界最大 GPU,售價為:39.9 萬美元,「相當於需要消耗 180 千瓦的 300 台雙 CPU 伺服器,那可得要 300 萬美元!這個只需要 1/8 的成本,1/60 的空間,1/18 的功耗。」不得不說,黃教主在說這一段的時候,像極了電視購物種的導購員。當然了,仍然離不開他那句名言:「你買得越多,省的就越多。」

同樣的,小道消息中所謂的「挖礦」專用顯卡,也沒有出現。

除了 GPU,這些進化你值得一看

NVIDIA GPU Cloud

機器學習有什麼樣的特點?黃教主說:可編程性、延遲、精確、大小、吞吐率、能耗效率、學習率,這幾個詞語的英文單詞開頭,連起來是一個詞語:PLASTER,黃仁勛說:「我希望你能記住這些東西。推理很複雜,一點兒也不容易。超大規模數據中心是迄今為止製造的最複雜的計算機。」

「我們都置身人工智慧的舞台上。」老黃說,「計算正在呈指數增長。深度學習模型的有效性正以雙指數增長——更多數據、更多計算——為 AI 創建了雙指數。」

「這個系統很複雜。這個軟體很複雜。因此,英偉達創建了容器來存放優化吼的軟體。你可以把它們想像成特百惠。我們稱之為 NVIDIA GPU 雲(NVDIA GPU Cloud),簡稱 NGC。」

黃教主接著誇道:「這些 NGC 容器非常棒。無論使用哪種雲,你都可以使用相同的堆棧。我們已經擁有 20,000 註冊用戶,30 個容器,高於去年不少。NGC 已在我們運行的數據中心獲得認證—包括 AWS、Google 雲、Oracle 雲、阿里雲。它是唯一能夠在任何雲上運行的體系結構。」

(小編註:黃教主誇自家平台的時候嘴瓢了,誇到忘詞也是沒誰了)

TensorRT 4

TensorRT 於 2016 年 9 月推出,TensorRT 2 於 2017 年 4 月推出;TensorRT3 於 2017 年 9 月推出。現在該是 TensorRT 4 了——它可以處理遞歸神經網路,並且已經深度集成到 TensorFlow 中。完成神經網路的訓練之後,用戶可以直接在設備上運行這些神經網路。現在,英偉達在整個軟體堆棧中實現了完全優化—TensorFlow、Kaldi 優化、ONNX、WinML,TensorRT 現在可以加速語音、對話、自然語言處理、自然語言理解。

簡而言之,TensorRT 進步的成果為:圖像加速了 190 倍,NLP 加速了 50 倍,推薦引擎加速了 45 倍,語音加速了 36 倍,語音識別加速了 60 倍。英偉達將超大規模數據中心的速度提高了 100 倍,就像老黃說的:這可以省很多錢。

黃教主還展示了一個識花應用程序。雖然以前演示過這個 demo。

在 CPU 上運行時,它開始每秒能識別 4 種花。 當這個程序在 Volta 架構的 NVIDIA GPU 上運行時,在同一網路的一個 GPU 上每秒能識別 873 種花。 運行在 Kubernetes 中,創建作業的副本,現在已經能做到每秒識別七千張圖片。

「這就像魔法一樣,」老黃說。

自動駕駛或將迎來大規模推廣

自從英偉達的晶元被為自動駕駛行業大量使用開始,黃老闆在每屆大會上都會提到有關英偉達在自動駕駛領域的進展情況。

從英偉達宣布 NVIDIA DRIVE 項目開始,到今天,已經過去了六年的時間,去年 GTC 大會上,黃仁勛亮出了一份名單,上面有全球 145 家自動駕駛初創公司的名單,這 145 家公司正在研製基於 NVIDIA DRIVE 的自動駕駛汽車、卡車、高清製圖及服務。而今天的大會上,黃仁勛宣布,這個名單已經增長至 370 家。

「任何會移動的東西都將變得自動化。 」

黃仁勛在自動駕駛部分的演講開始時說了這樣一句話。他解釋說,這是因為人們正在因為擁擠而遠離城市,而網上購物需要很多車來給我們送貨,另外 10 億輛汽車將在未來 12 年內進入社會;停車場是必需的,但大多建在城市中心。

之後,老黃提到了前不久的自動駕駛事故,他說:「安全是唯一也是最重要的。這是世界上最難計算的問題。最近這次致命事故提醒我們,這項工作至關重要。我們需要一步一步地解決這個問題,因為事關重大。如果我們做得好,我們將能夠拯救很多生命。"

黃仁勛認為,這是最終極的深度學習和人工智慧問題,他說道:「即使我們發現了錯誤,也必須加以管理。」功能安全的標準非常非常高,據介紹,英偉達已經花了五到七年的時間來了解這個系統,他們正努力堅持到底。

老黃詳細介紹了 NVIDIA 的感知基礎架構 :

每輛車都在收集數百萬位元組的數據,我們需要用數據中的元素對他們進行標註——每個月需要 1500 人給 100 萬個元素做標註 ;

訓練在 NVIDIA DGX 系統上進行,然後對其進行驗證 ;

最後通過這個系統創建網路,現在在汽車中有 10 個網路。每個網路分配有 10 個 DGX。

這 10 個網路包括感知、自由空間距離感知、天氣、激光雷達感知、基於攝像頭的映射、攝像頭到高清地圖的定位、激光雷達到高清地圖的定位、路徑感知和場景感知。

老黃隨後展示了他所謂的自製視頻,它突出展示了同時運行的各種神經網路。它展示了自動駕駛汽車如何操作和處理剎車燈、左轉和其他複雜情況。 有幾千名工程師正在從事這項工作,他們為此工作兩三年,然後我們才能開始批量生產。「這是我們遇到過的最複雜的計算問題之一,而且安全問題成倍增加。」老黃補充道。

升級版的體系架構

為什麼不直接放一輛車來演示一下呢?黃仁勛解釋說,他們正在努力打造一套自動駕駛汽車的行駛流程和基礎設施,以便整個行業能夠利用這套東西,打造自動駕駛汽車的未來。「但是每輛車都應該藉助人工智慧來監視我們,確保我們的視線是活躍的,而不是在打瞌睡。 」

黃仁勛展示了一個架構路線圖:從只有一個晶元的 Driver PX Parker 開始,發展到擁有四個晶元的 DRIVER PX 2,然後英偉達推出了 DRIVER Xavier (包含這四個晶元的計算能力,並將其縮小為一個——這是目前英偉達打造的最大的單個晶元(Volta 除外),有 90 億個晶體管;現在正在製造樣品)。

基於 Xavier,英偉達創造了一個四晶元系統,擁有兩個 Xavier 和兩個 Volta——這台 300 瓦的計算機正被用於機器人汽車中,今年晚些時候將投入生產。它們是自動駕駛級別的,超級節能,而且是 ASIL - D,達到了最高的功能安全標準。

「雖然 DRIVER Peagasus 已經很強大了,而且很多自動駕駛汽車正在使用它。我們的下一步稱為 Orin——我們將採用 8 個晶元,兩個 Pegasus,並把它們放入兩個 Orin。這是我們的路線圖。」雖然大會已經過去兩個小時,但是「雞血」老黃似乎毫無倦意,仍然精力充沛地講著。

在美國,每十億英里就有 770 起事故發生。一支由 30 輛測試車組成的車隊每年行駛 100 萬英里。黃仁勛說,英偉達正在試圖建立一個比人類更好的系統,但這在現實生活中是不可能的。

因此,需要在各種條件下,通過模擬現實情況的逼真度和性能,來重建現實環境,英偉達創造了 DRIVER Sim,它是能夠創造整個世界的圖像生成器。我們用一台自動駕駛汽車的計算機代替了駕駛員,DRIVER Xavier 和 Pegasus 組合在一起,以感知周圍的虛擬世界——它被稱之為 DRIVE CONSTELLATION。

東海岸的自動駕駛發布會

在 GTC 開場之前,美國東海岸的紐約,自動駕駛公司 Waymo 也沒閑著,Waymo 無人車發布會早於 GTC 兩個小時開始。

Waymo 和捷豹 CEO 聯合宣布:聯手設計和製造世界上第一款為 Waymo 運輸服務而製造的高級電動全自動駕駛車輛,這款全新自動駕駛捷豹 I-PACE 將捷豹的創新設計與 Waymo 的尖端自行駕駛技術融合在一起。

Waymo 的 CEO,John Krafcik 在發布會上表示:未來幾年內,我們將為 Waymo 的機隊增加 2 萬個 I-PACE,這足以在典型的一天內驅動約一百萬次旅行。通過這種合作關係,我們可以為全國各地的許多社區提供安全,安靜和環保的自駕車服務。

回想幾天前的 Uber 無人車事故,雖然全球震驚,但是似乎並沒有影響到太多的自動駕駛企業,包括 Waymo 在內的多家自動駕駛公司都沒有選擇暫停路測,而是繼續改善、提升無人車的安全性。

Waymo 今天發布會上正式聲明,標誌著自動駕駛服務正在開始逐漸走上正軌,2018 年或將成為自動駕駛技術正式落地的元年。

結尾

這篇文章完成時,已經是北京時間凌晨 3:00 了,GTC 2018 的新年開箱大會圓滿結束。簡單總結一下:

晶元和雲方面

英偉達將 Volta V100 的內存提高一倍,達到 32GB

發布了全新的 DGX-2,配備 32GB 的 V100

NGC 現在已經在 AWS、谷歌雲、阿里雲和 Oracle 雲上運行

具有 30 個優化容器的 NVIDIA GPU 雲

TITAN V 依然缺貨

自動駕駛方面

安全很重要

發布了 Driver 晶元的線路圖,下一款產品將是 Orin

發布了駕駛環境模擬器:DRIVE CONSTELLATION

可利用 VR,遠程操控無人車

不可否認,英偉達依舊是目前世界上最有前途的晶元公司之一,黃老闆的一張大手幾乎伸到了科技圈的各個領域,這家總是不斷帶給我們驚喜的公司用實際行動推動著世界科技的發展,接下來,GTC China 2018 大會,黃教主還會放出什麼樣的大招?我們拭目以待,蘇州見!

今日薦文


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 AI前線 的精彩文章:

看谷歌團隊如何做位置偏差估計
剛剛,傅盛正式發布了第一款區塊鏈AI音箱

TAG:AI前線 |