當前位置:
首頁 > 新聞 > 英偉達:比起股價,我們更關注計算的未來

英偉達:比起股價,我們更關注計算的未來

英偉達 GTC 中國大會這次搬到了蘇州。最近,人們關注的除了最新 GPU 產品之外,更多的是這家公司未來的發展方向。

今年的 GTC 系列大會已是第十屆,也是連續第三次進入國內,和每次一樣,英偉達首席執行官黃仁勛參加了本次大會,並在首日上午進行了主 Keynote 演講。

談到深度學習機器,我們首先想到的就是以 GPU 為核心的計算機。不過,英偉達早已不滿足於晶元,近幾年開始了垂直方向的擴展,我們可以在很多地方看到英偉達的軟體、伺服器,甚至自動駕駛汽車。但一直以來就像在遊戲和高性能計算中所做的那樣,這家公司一直致力於為客戶提供更多選擇。

「如有需要,你可以自行採用英偉達產品的任何一部分。」

重新定義圖形計算

「我們今天首先要介紹的是,英偉達如何重新定義了圖形計算。」黃仁勛以最新的 RTX 技術開始了自己的演講。最近英偉達發布了新一代消費級顯卡 RTX 20 系列。使用 Tensor Core、RT Core 和可編程著色器的架構,Turing 架構的 2080 Ti 峰值算力要比 Pascal 架構的最強晶元 Titan Xp 強 9 倍。

因為擁有算力達到 104TFLOPS 的 Tensor Core,通過實時的計算,RTX2080 可以通過輸入低解析度圖像,輸出高清圖像。黃仁勛在會上展示了國產遊戲《逆水寒》最新版本的圖像水平。其模型和光源在水面和光滑物體上的反射栩栩如生。「即使是雨點落在水面上產生了波紋,效果也是和真實情況下一樣」黃仁勛表示。「所有效果都是即時演算得出的,而對於開發者來說,需要額外做的工作也很少。」

英偉達:比起股價,我們更關注計算的未來

打開今日頭條,查看更多精彩圖片

在 Turing GPU 上,英偉達加入了全新的深度學習超級採樣(DLSS)技術。基於 Turing 架構的 DLSS 由兩個模型組成,其中一個模型經過訓練後可根據原始圖像生成超高畫質圖像,另一個經過訓練後可實現超解析度並以此作為輸出。經由 Tensor Core 的計算,RTX 系列顯卡可以同時實現高畫質和高解析度。

當然,這些演算法看起來只對擁有 Tensor Core 和 RTX Core 的新產品有優化,和上一代產品相比,RTX 顯卡在光線追蹤和 DLSS 上的性能達到了 3.5 倍的提升。

AI 自動化的世界

英偉達 12 年前推出編程計算平台 CUDA 的時候,其應用範圍僅限於高性能計算。隨著 GPU 被廣泛用於深度學習,這家公司已在在 CUDA 上加入了很多新的功能,比如適用於 Tensor Core 的相關 API。

AI 改變了英偉達的晶元、軟體設計,也重塑了市場:2005 年的雲伺服器的算力輸出基本全靠 CPU,而今天全球最強的兩台超級計算機 Summit 和 Sierra 中,95% 的算力是由英偉達 GPU 提供的,其中在第一名 Summit 中有 27,648 塊 Tesla V100。而在全球能效最強的 25 台超算中,有 22 台包含英偉達的晶元和技術。

英偉達:比起股價,我們更關注計算的未來

與生活密切相關的網上購物、醫療、交通等方面都離不開 AI 應用。今年的雙 11,阿里巴巴的銷售量達到了 310 億美元,其中基於大數據的智能推薦功不可沒。

黃仁勛認為,AI 讓高性能計算領域產生了變革,今天人們有兩種擴大伺服器算力的方式:第一種是傳統 HPC 模式,在單個伺服器上增加算力;另一種是 Hyperscale,通過擴大小模組的數量增加算力,超大規模節點必須作為一個計算集群,訓練模型或分別為運行 AI 模型的數百萬並發用戶提供服務。

英偉達 GPU 在兩種方向上都有自己的產品。HPC 模式對應的是「世界上最大的 AI 計算機」HGX-2 平台,其中一個模組可以支持 8 個 V100 GPU,實現 1PFLOPS 的算力。

英偉達:比起股價,我們更關注計算的未來

HGX-2 的板卡很沉,習慣手舉 GPU 擺造型的黃仁勛拿起來有點費勁,不禁自嘲:「I"m getting old.」

目前已經在製造 HGX-2 伺服器的國內公司包括,華為、浪潮、聯想、QCT、曙光和 Supermicro。很多公司為了構建雲伺服器購買了 HGX-2 平台,而百度和騰訊還將要開放基於 HGX-2 的雲計算服務。

在 Hyperscale 的一邊,英偉達為大規模計算集群準備了「第一塊 Hyperscale GPU」Tesla T4 計算卡,以應對低延遲任務的需求。

30 天前,英偉達發布了 Tesla T4 雲計算 GPU。這款計算卡包含 320 個 Turing 架構的 Tensor Core、2560 個 CUDA 核心,可輸出 64TFLOPS 的 fp16 算力,而功耗僅為 70W。「它的功耗比 CPU 還要小,算力卻比 CPU 要高 400 倍,」黃仁勛表示。

英偉達稱,僅僅一個月的時間裡,各大服務商已經推出了 50 種該型號的計算卡。在國內,科大訊飛等公司已宣布開始使用這種 GPU。

配合新一代的推理優化工具 TensorRT 5.0,T4 支持 Tesnor Core 和豐富的模型類型,CNN、RNN、MLP 和很多其他模型。

機器學習軟體

今天的深度學習軟體正變得原來越複雜,對於開發者來說最重要問題的是如何進行部署。

英偉達的新版 TensorRT 推理伺服器現在是容器化的,可以在 Kubernetes 上運行。在大會上,英偉達宣布 TensorRT Inference Server 已經開源,黃仁勛拿百度雲上的 Tesla T4 GPU 為這一工具做了例子:在容器中,我們可以運行任何深度學習模型,並讓不同模型同時運行在同一個計算卡上以提高效率。

英偉達近日在 GTC 歐洲大會上發布了 RAPID,可讓端到端工作負載加速 50 倍。「很多時候人們談到 GPU 時都在說深度學習,現在有了 RAPID 軟體,我們更可以加速機器學習。」黃仁勛表示。

英偉達:比起股價,我們更關注計算的未來

RAPID 是一個開源機器學習庫,其中 CUDA 負責加速數據科學工作負載,另外幾個組件的功能則使用了很直白的形容方式:cuDF「類似於 Pandas」,而 cuML「類似於 ScikitLearn」。

機器學習意味著英偉達的產品正在進入更多行業,在國內,RAPID 已被一些傳統公司採用。華大基因、中國移動和平安科技已經在使用 RAPID 了。

「如果我們用常規架構的計算方式,可能要花 6 個月來預測流感,」黃仁勛說道,「等計算機『預測』出來,流感早就結束了。有了 RAPID,計算機處理速度提高了 50 倍,問題很快就解決了。」

2005 年,各家研究機構用在科學計算上的花費有 90 億美元,今天如果把百度、騰訊、阿里等公司的高性能計算花費加在一起,市場可以達到 370 億美元,這其中很大一部分是深度學習和機器學習的計算。英偉達的產品已經能夠覆蓋所有這些計算需求了。

開放系統

英偉達花費 20 億美元研發的 Xaiver 是一塊集中程度很高的晶元,它被黃仁勛稱為目前全球效率最高、最複雜的處理器,其上集中了 90 億個晶體管,集成了英偉達自動駕駛汽車的所有最新技術。在 Xavier 中有 5 種不同的處理器:CPU、GPU、圖像處理器、深度學習加速器、信號處理器。在英偉達的眼裡,這款晶元被設計用於「自主機器」,包括自動駕駛、機器人和各種智能設備,它最多可以輸出 320TOPS TFLOPS FP32 算力。

英偉達將 Xavier 晶元和其他一些自動化相關業務歸類在新品牌 Nvidia AGX 中。

在晶元之上,AGX 平台還包括 Clara 智能成像儀、Metropolis 視頻流分析應用程序、Isaac 機器人技術,以及 DRIVE 自動駕駛汽車平台。在這些平台中,每個加速堆棧都由三層組成:

  1. 內核操作系統和工程 API
  2. 演算法和加速庫
  3. 特定領域演算法或應用


英偉達稱,每個平台都是開放的,開發者和客戶可以訪問任何層,並選擇使用每個層的所有部分。

英偉達:比起股價,我們更關注計算的未來

平台的構建速度如何?黃仁勛在大會上公布了應用 Xavier 的首批國內廠商,京東、美團、菜鳥的無人遞送車已經選用了 Jetson AGX Xavier,它們中的一些正在展開測試:「在國內,每天都有百萬騎手負責遞送 3000 萬份外賣,想像一下如果他們都被無人車代替以後,效率會提高多少倍!」

英偉達同時宣布面向自動駕駛的 NVIDIA DRIVE 開發系統已經上市,其中包括用於監控駕駛員的 DRIVE IX,以及 DRIVE AGX Xavier 開發套件。這一軟體堆棧支持完全自動駕駛所需的功能,從感知到定位,再到路徑規劃。

英偉達還在現場展示了在美國加州高速公路上 50 英里環線的 Level2 級自動駕駛。面對此前「Level 4 很難實現」的呼聲,這家公司的高官們有著特別的看法。「對於消費者來說,他們不需要了解什麼是 Level 幾,」英偉達副總裁 Rob Csongor 表示。「他們只會選擇當前最好的自動駕駛體驗。雖然在 Level 2 中人還需要隨時接管,Level 4 則意味著人可以在后座睡覺了。」

英偉達發現 level 2 和 level 4 的自動駕駛在功能上是完全一樣的,使用的軟體堆棧也是類似的。在美國目前賣得最好的車款 Tesla Model 3 上,我們可以找到自動駕駛功能,但我們仍然需要在駕駛時把手放在方向盤上。「這是一個有關認證的問題,英偉達在自動駕駛上的戰略,你現在可以把它視為是面向 Level 2 的,但以後它可能會被認證為 Level 4。」Csongor 稱。

英偉達在大會上宣布了與沃爾沃的合作:幾個月後,擁有 Level2 自動駕駛的新款沃爾沃 XC60 就會上線。除此之外,已有超過 370 家公司在自動駕駛系統中使用了 DRIVE 平台。

英偉達:比起股價,我們更關注計算的未來

在 GTC 中國之前,英偉達最大的新聞就是 11 月 16 號剛剛公布的今年第三季度財報了。報告顯示,英偉達第三季度營收為 31.81 億美元,與上年同期 26.36 億美元的數字相比增長了 21%;公司凈利潤為 12.30 億美元,與上年同期的 8.38 億美元相比增幅達到 47%。儘管如此,市場普遍認為此數字低於預期,其股市也經歷了大幅震蕩。

「股價的確很重要,(最近的下跌)一部分是由於加密貨幣的影響,一部分是因為經濟大環境。但是這並不是我們所關注的全部。」英偉達全球副總裁 Jay Puri 在大會上表示。「英偉達的眼光放在未來的計算。我們關注遊戲、高性能計算、機器學習、自動駕駛等等。」

面對有關股價的擔憂,英偉達給出的回應是:我們還有更重要的事去做。就像黃仁勛所說的,「如果大家都在做同一件事,英偉達就不會佔據優勢,我們會去挑戰最困難的問題。」這也是英偉達一直以來的生存之道。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

AI頂會ICLR找來論壇和推特網友當論文評審,這樣真的靠譜?
首次對外界開放的華為全聯接大會,有你對AI的期待

TAG:機器之心 |