當前位置:
首頁 > 新聞 > 黃仁勛北京演講:GPU帝國啟幕,發布可編程AI 推理加速器TensorRT 3

黃仁勛北京演講:GPU帝國啟幕,發布可編程AI 推理加速器TensorRT 3

TensorTR 3,英偉達迎接谷歌TPU的一招。

新智元報道

【新智元導讀】GTC CHINA上,黃仁勛展示了英偉達強大的生態系統建構能力,在圍繞GPU的計算生態中:BAT已在雲服務中使用GPU,華為、浪潮和聯想也都使用GPU伺服器,此外還有海康威視、科大訊飛和京東也都在積極使用GPU產品。GPU的計算帝國已然呈現。另外,黃仁勛在北京現場重磅發布了可編程的AI 推理加速器TensorRT 3,從功能上看與TPU有眾多相似之處。演講中,黃仁勛特別提到了自動駕駛和自主機器,這將是英偉達接下來發力的重點。

2017年9月26日,北京,英偉達GPU技術峰會GTC CHINA 開幕。英偉達創始人兼CEO黃仁勛發表主旨演講。

生態:GPU帝國,BAT、華為浪潮聯想,1900家創業公司統統包括

「Welcome Beijing!」黃仁勛揮著手激動上台,然後直奔主題。

首先,黃仁勛講了兩股力量推動計算領域發生改變。第一次是摩爾定律的結束,加快、加深管道,讓CPU設計者在片上放下越來越多的晶體管。但是,現在這樣做越來越來難以持續,晶體管每年增長50%,CPU性能卻只以10%的速度增長。

另一方面,新的計算模型,也即深度學習,以暴風般的速度和大數據一起席捲而來。

深度學習研究者發現了GPU的力量。

一方面發現新的計算模型,持續提升性能。每一代都能夠將更多晶體管的數量轉換為計算力。讓一個月的計算縮減為一天。

GPU的崛起,單從GTC的參會人數就能看出來。在短短5年間,GTC的參會人數就堪比大型會議,今年有22,000人蔘會。

黃仁勛在演講中提到,摩爾定律已經是昨天的定律,是一種緩慢的定律,我們現在處於超級摩爾定律時代。

在展示了GPU的獨特性能和為深度學習而生的歷史使命之後,黃仁勛展示了英偉達更加強大的一面——生態系統。圍繞著英偉達而生的GPU帝國似乎已經成型,他在現場宣布,阿里巴巴、百度和騰訊都已經在雲服務中使用GPU,另外華為、浪潮和聯想也都採用GPU伺服器。

另外,他還介紹了面向全球開發人員的NVIDIA.AI。英偉達將會全力推進「統一架構」 CUDA GPU計算。通過Inception計劃,支持1900家初創企業。

從CUDA開始,英偉達其實一直做得最出色的便是打造生態系統的能力,在GPU性能不斷受到關注的今天,有人指出,英偉達的技術也許不是最強的,但是他們打造生態系統的能力和決心絕對不容忽視。未來,GPU帝國終會成型。

關於英偉達在中國打造的計算新紀元,下面這張圖是很好的說明:

最重磅發布:NVIDIA TENSORRT 3,應對TPU

在本次大會上,黃仁勛發布了本次發布會英偉達最重要的一個產品NVIDIA TENSORRT3——一款可編程的AI 推理加速器。支持所有的框架,比如Caffe,Pytorch和TensorFlow。

正是因為具備相對良好的編程環境,GPU成為目前最主流的深度學習硬體。英偉達公司發布的CUDA運算平台,是專門針對開發者提供的一種並行計算平台。開發者能通過CUDA平台使用軟體語言很方便得開發英偉達GPU實現運算加速。由於CUDA平台之前被廣泛認可和普及,積累了良好的編程環境,目前應用在人工智慧領域、可進行通用計算的GPU市場基本被英偉達壟斷。

現在,英偉達推出加速推理的TensorRT 3,可編程,支持所有框架,所有機器,可以想見,又會擴大另一大片市場。

從黃仁勛現場的介紹來看,TensorRT 3主要的功能是推理和加速,這與谷歌的TPU功能類似。

黃仁勛在現場說,神經網路的響應時間或處理延時會對服務質量造成直接影響。運行在V100上的TensorRT在處理頭像時刻實現7ms的延時,在處理語音時延時報道200ms,這是標準雲服務的理想目標。單靠CPU是無法實現的。上圖,藍色是CPU運行TensorFlow。

接下來黃仁勛介紹了AI 推理在數據中心的應用,最主要的是是降低成本,在這裡依然是與CPU直接作比較,他說,V100相較CPU加速了40倍。

提到省錢,黃仁勛說:「你買越多的GPU,你節省的錢就越多。」

原來,4個機架,160CPU,65KW

現在,1個機架就行了,節省50萬美元

黃仁勛來來回回將4個機架和1個機架的圖像進行對比,他說自己可以玩上一整天。「更少的空間,更少的主機,節省更多錢!」

How exciting is that!

Demo 圖像處理和聲音處理

為了展示TensorTR 3的性能,台上做了挺多展示。其中有《權力的遊戲》的展示,用語音搜索「冬天來了」,首先轉換成文字,然後直接跳到那一幀。語音到文字的轉換,龐大的視頻數據,幾乎沒有延遲,達到可以商用的程度。

黃仁勛說,有了TensorTR 3,將來我們不需要龐大的數據中心,更多樣的應用,「節省更多的錢」!

然後他宣布,中國AI五巨頭——阿里巴巴、騰訊、百度、京東、訊飛,都已經採用了英偉達的推理平台。

不僅如此,英偉達還與海康威視聯手,利用TensorRT,發布端到端的智能視頻解決方案,目標是直接從視頻中尋找答案。

海康威視的合作屬於智慧城市(AI CITY)的議題。在這方面,英偉達與大華、華為和阿里巴巴也有合作。

所有這些,都是希望用一個推理平台,解決不同類型的數據和應用案例的問題。

力推自動駕駛汽車變革

黃仁勛展示了圖中是英偉達與空客正在實際進行的項目。分為三部分,車架、車廂和自動飛行的機翼——將來,你能自動駕駛到一個地方,然後讓機翼來接你,自動飛行到另一個地點。

英偉達的自動駕駛平台,支持L3、L4、L5。

感知(用雷達、激光雷達和其他感測器感知周圍環境),推理(定位),規劃(比如如何行車變換軌道)是自動駕駛三大核心要素,會議現場展示了英偉達自動駕駛平台的效果。

145家初創公司基於NV Drive開發自動駕駛平台,包括Pony.ai、圖森和景馳等。

自主機器新紀元:京東X 選擇Xavier實現自主機器

黃仁勛說,自動駕駛汽車的根本的目標是「避免碰撞」,因此即使起影響巨大,但技術上卻是自動機器當中最簡單、最容易實現的。

黃仁勛說,下一個AI時代,是AI離開雲端,走入與人類交互的機器中來。

接著,黃仁勛發布了全球首款自主機器處理器 Xavier,將在2018年第四季度推出。

Xavier實時運行並行演算法,推理周圍世界,最後進行規劃。這是世界上最複雜的SoC——將超級計算機變為一張晶元。

黃仁勛介紹,這款晶元是世界第一,英偉達幾年前開始做這個項目,代號Project Xavier。

接著,他宣布京東X與英偉達合作,使用Xavier晶元,實現自主機器。

還沒有完!

英偉達還發布了一個能夠實時訓練機器人的模擬環境 Isaac Lab。Nvidia虛擬現實模擬器實驗室來構建機器人 isac lab 演示了如何玩曲棍球和高爾夫。

Tesla V100 GPU、可編程推理平台TensorRT 3,自動駕駛平台、自助機器超級Soc Xviare,還有虛擬機器人訓練環境,可以說,英偉達的AI布局全線鋪開,沒有放過任何一塊。

除了深度學習,黃仁勛在這次GTC上還頻頻提到遷移學習、VR。其中,最顯眼的無疑是TensorRT 3。推理是一個巨大的市場,潛力無限,而英偉達已經用TensorRT 3搶佔先機,並且已經佔據了中國AI五巨頭。

【號外】新智元正在進行新一輪招聘,飛往智能宇宙的最美飛船,還有N個座位

點擊閱讀原文可查看職位詳情,期待你的加入~

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

英特爾研發神經元晶元,模擬人腦自學習能效提升1000倍
「黃仁勛北京演講」GPU帝國啟幕,發布可編程AI 推理加速器TensorRT 3(PPT實錄)
自然語言處理終極方向:深度學慣用於自然語言處理的5大優勢
「遷移學習」6張圖像vs13000張圖像,超越2013 Kaggle貓狗識別競賽領先水平
「阿法狗只是小兒科」5年內,AI將問鼎星際爭霸,橫掃人類玩家

TAG:新智元 |