當前位置:
首頁 > 最新 > 英偉達黃仁勛發布全球最大GPU,超300斤,汽車後備箱大小

英偉達黃仁勛發布全球最大GPU,超300斤,汽車後備箱大小

大數據文摘作品

作者:魏子敏、雲舟、龍牧雪

這一次的GTC大會可能讓不少礦工略微失望,英偉達並沒有如傳言所說發布一款「挖礦」專用晶元,但這並不影響這場持續三小時的英偉達2018GTC大會的精彩。

當地時間3月28日上午9點,英偉達創始人兼首席執行官黃仁勛在San Jose McEnery 會議中心,開啟了第九屆年度 GPU 技術大會 (GTC)。

按照慣例,黃教主依然一身皮衣登場,激情滿滿完成了本次大會的keynote演講,並發布了一系列英偉達的新產品。

先來一睹為快本次發布會的精華內容:

發布全球首個基於Volta架構的GPU——GV100,並與醫療影像行業結合;

DGX2——世界最大GPU誕生!重達350磅,有汽車後備箱那麼大;

TensorRT 4發布,為超大規模數據中心提速100倍;

發布針對自動駕駛場景的解決方案。

本次大會的四大主題

圖像、科學、AI、機器人

「今天,我們將討論令人驚訝的圖像,令人驚訝的科學,令人驚訝的人工智慧和令人驚訝的機器人。」剛一上場,黃教主就帶著他一貫的激情脫口而出了四個「令人驚訝的」。

黃教主首先回憶了第一部電影的誕生,以及電影工業的發展。而這一切離不開GPU的支持。

發布全球首個基於Volta架構的GPU——Quadro GV100

「15年來計算機圖形學最重要的進步」

今天發布的第一款產品是Quadro GV100——世界上第一款基於Volta架構的GPU工作站。它的創新之處是帶有一個名為NVLink 2 的全新連接點,這一連接將編程和內存模型從一個GPU擴展到第二個,從而鏈接起來,使它們像一整個GPU那樣工作。這兩個GPU共有10,000個CUDA內核,236個teraflops的Tensor Cores和64GB內存。

「現在每年產生10億張圖片,而且可以再增加10倍,因為Quadro可以把實時渲染降低到現有成本的1/5,現有空間的1/7,和現有功耗的1/17」,黃教主接著說道。

這一產品的主要使用場景是計算機圖像,例如電影和遊戲產業。黃仁勛接下來展示了目前已經有的三十多個主要合作夥伴,涉及遊戲、設計、電影、建築等行業。他非常激動地稱,這項技術是15年來計算機圖形學最重要的進步。

與醫療影像結合,推出虛擬化數據中心

這一晶元產品的另一個可廣泛應用的領域是醫療行業。

黃教主展示了一張15年前的超聲波圖像並將其與一張現在的超聲波圖像比較。可以明顯看到前者模糊的灰色像素,而後者甚至可以看到胎兒的準確膚色。

正是因為基於GPU的計算技術發展,現在可以比以前更好地重建圖像,通過渲染來釋放更多洞察力並迅速可視化圖像。為了確保這一技術更好更快地應用到醫療行業的硬體設備上,英偉達還為此推出了Clara項目——遠程、多模式、多用戶的虛擬化數據中心,可以為每個系統進行虛擬更新。

黃教主說,英偉達在現代醫學成像方面所做的工作是他最感到自豪的事情之一。

DGX-2——世界最大GPU誕生!

這個龐然大物包含20億個晶體管,其中每個GPU都通過光纖交換機通信,所以它的工作原理更類似一個開關,而不是一個網路。

這款GPU重達350磅(超過300斤),有汽車後備箱那麼大,「沒有人能把它舉起來」,黃教主調侃道。

DGX-2的處理能力是去年9月發布的DGX-1的10倍以上。

DGX2示意圖

這款全球最強大的電腦售價為39.9萬美元(約250萬人民幣)。

黃教主稱,它可以取代300台消耗為180千瓦的雙CPU伺服器,而這三百台計算機總價值為3百萬美元,使用DGX-2可以將成本降為之前的八分之一,並將佔地空間降到之前的六十分之一。

5年前,在2個GTX 580上訓練Alexnet神經網路需要花費6天,但現在使用DGX-2隻需要訓練18分鐘。時間單位從「天」降低到「分鐘」,產生巨大對比。

發布NVIDIA GPU Cloud(NGC)

黃教主接著說道:「在數據和計算量的『雙重指數級』增長的背景下,出於為越來越複雜的系統和軟體提供支持的目的,我們發布了NVIDIA GPU Cloud(NGC)。」

不論使用什麼雲,都可以在NGC上使用相同的堆棧,現在的NGC已經有了兩萬註冊用戶,而這僅僅是去年發布後的一小部分。NGC已經通過了AWS、Google Cloud、Oracle Cloud和阿里雲的認證。它是一個能在任何雲上運行的唯一體系結構。

TensorRT 4發布,超大規模數據中心提速100倍

黃教主用一張幻燈片展示了超大規模數據中心需要考慮的7個重要因素,並強調,超大規模數據中心是有史以來最複雜的計算機。

目前世界上大概有3千萬台超大規模伺服器。英偉達在2016年9月推出TensorRT,這是專門用來服務超大規模數據中心的晶元。

2017年4月推出TensorRT 2;2017年9月推出Tensor RT 3。今天英偉達發布了TensorRT 4——它可以處理循環神經網路,與TensorFlow深度融合。完成網路訓練後,它可以直接在設備上運行。

Tensorflow官方推特也同期發布了這一消息

黃教主稱,這一更新可以讓圖像加速190倍,自然語言處理加速50倍,推薦引擎提速45倍,語音提速36倍,語音識別率提高60倍。「總體而言,我們將超大規模數據中心的速度提高了100倍。會節省很多錢。

黃教主接下來發布了Kubernetes,用來協調數據中心伺服器海洋中的工作負載——目前已經可以被GPU識別。

發布針對自動駕駛場景的解決方案——Perception基礎架構

「安全是最重要的一件事。這是最難的計算問題。發生致命事故後,我們提醒自己,這項工作非常重要。我們需要一步一步地解決這個問題,因為這麼多事情都處於危險之中。如果我們做得對,我們有非常大的機會挽救生命。」

而對於無人車的安全性,高效可用的晶元被擺上了舉足輕重的地位。英偉達稱已經花了五到七年的時間來了解這個系統。「我們正試圖從頭到尾思考這個問題,這裡的四個支柱是:收集數據,訓練模型,模擬,駕駛。」

黃教主接下來推出並詳細介紹NVIDIA應用於自動駕駛場景的Perception基礎架構:

每輛汽車都在收集PB級的數據,我們將其標記為數據因子 - 每月有1500人來標註100萬件物品;

我們在NVIDIA DGX系統上進行訓練,然後我們進行驗證;

最終創建網路,我們現在在車上有10個網路。每個網路有10個DGX分配

這10個網路涵蓋感知、自由空間距離感知、天氣,激光雷達感知、基於相機的映射、相機定位到高清地圖、激光雷達定位到高清地圖、路徑感知和場景感知。

「我們正在試圖創建一個自動駕駛汽車流量和基礎設施,這樣整個行業就可以利用這一點,並創造出自動駕駛汽車的未來。」

不過,據海外媒體TechCrunch報道,在Uber事故後,英偉達已暫停其自動駕駛測試。不知是否受此影響,英偉達股價今天持續走低,累計下跌超9%。

【今日機器學習概念】

Have a Great Definition

志願者介紹

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 大數據文摘 的精彩文章:

別錯過這張AI商用清單:你的生產難題可能被一個應用解決
谷歌、蘋果、Uber等科技巨頭們,為何紛紛暫緩研發自動駕駛

TAG:大數據文摘 |