當前位置:
首頁 > 最新 > GTC2018八大熱點:發布多項黑科技,聯合晶元巨頭ARM打造AI晶元專用IP

GTC2018八大熱點:發布多項黑科技,聯合晶元巨頭ARM打造AI晶元專用IP

一年一度的GTC至今已經迎來了第十個年頭,雖然它每年或多或少的給網友一些「失望」,但它也終究是代表著GPU行業的高水平技術大會。那麼,今年的GTC大會,英偉達又給業界帶來了哪些驚喜呢?

北京時間今天凌晨,英偉達公司創始人兼首席執行官黃仁勛宣布了該公司在晶元、AI 平台、自動駕駛上的一系列新動作。

一、光線追蹤(ray-tracing)

開場介紹的第一個項目就是英偉達在前不久GDC上發布的NVIDIA RTX光線追蹤技術(ray-tracing),這項技術是英偉達耗時10年打造的,能夠提供電影級畫質的實時渲染,渲染出逼真的反射、折射和陰影畫面,幾乎與真實世界的照片或視頻很難區分開來。現場展示的視頻片段就是用光線追蹤技術實時渲染的,而且並不需要一個超級強大的超算電腦,只需要一台DGX-Station。

在真實世界中,我們看到的3D物體被光源照亮,且光子可以在到達觀看者的眼睛以前從一個物體反彈到另一個物體。光線追蹤技術則是反過來,通過從我們的眼睛(觀景式照相機)反向追蹤光線捕捉這些效果,通過追蹤2D視表面上每個像素的光線的路徑,並應用到場景的3D模型中。

可想而知,這種技術的計算量非常大,一般渲染複雜的特殊效果可能需要花上幾天甚至幾周的時間,所以此前該項技術一直僅限於高成本的電影製作中。

不過,目前,隨著GPU性能日益強悍,能夠支持光線追蹤的電腦也越來越多,通過Volta架構的GPU配合英偉達的RTX技術,產品設計師、遊戲設計師、建築師們能夠在幾秒內即可生成逼真的產品模型。

二、新版Quadro GV100,首次採用Volta架構

Quadro GV100 具有 32GB 內存,且可藉助 NVIDIA NVLink 2 互聯技術,通過並聯兩塊 Quadro GPU 擴展至 64GB,在所有適用於此類應用的平台中其性能最高。

在性能方面,GV100 基於 NVIDIA Volta GPU 架構,可提供每秒 7.4 萬億次浮點運算的雙精度性能、每秒 14.8 萬億次浮點運算的單精度性能、以及每秒 118.5 萬億次浮點運算的深度學習性能。NVIDIA RTX 內置的 NVIDIA OptiX AI-denoiser 可實現實時的 AI 去噪,英偉達表示且其性能相當於採用 CPU 時的 100 倍。

三、醫療圖像處理超級電腦Clara

黃仁勛在現場推出了第一款專用於醫療圖像處理的超級電腦Clara,它能夠支持CUDA、CUDNN、TensorRT、OGL、RTX技術。

在現場,黃仁勛展示了一個醫療圖像實時處理的影像片段。這個段影像是用十幾年的超聲波老設備拍攝而成,本來只能看到2D的黑白圖像。然而當數據傳進Clara後,配合人工智慧軟體,可以在2D圖像中分析出3D的腔膛形狀(圖中紅色部分)。因此,醫院可以在現有醫療設備上直接接入這台電腦。

目前,英偉達正在和眾多醫療廠商合作,除了GE通用電氣、三星電子等大廠外,還有像圖瑪深維、推想科技等AI醫療創業公司。

四、新版 TensorRT 推理軟體 TensorRT 4,並將 TensorRT 集成至谷歌的 TensorFlow 框架。

這是一款可編程應用平台(Programmable Inference Platform),當你將一個神經網路訓練好了之後,可以通過TensorRT可編程平台,簡便快捷地將這個訓練好了的神經網路部署(Deploy)到英偉達的GPU上。

新版TensorRT 4能夠支持INT8和FP16精度運算,能夠將數據中心的功耗降低70%。而且,英偉達還與谷歌進行了深度合作,將TensorRT整合進如今最廣泛應用的AI開源框架谷歌TensorFlow 1.7中。而且現在還能夠加速圖像、視頻、語言、NLP等AI應用。

英偉達表示,TensorRT 4 可用於快速優化、驗證及部署在超大規模數據中心、嵌入式與汽車 GPU 平台中經過 訓練的神經網路。相比 CPU,針對計算機視覺、神經網路機器翻譯、自動語音識別、語音合成 與推薦系統等常見應用,該軟體最高可將深度學習推理的速度加快 190 倍。而且為了進一步精簡開發,英偉達與谷歌的工程師已將 TensorRT 集成至 TensorFlow 1.7,使得在 GPU 上運行深度學習推理應用更加容易。

五、AI平台新進展

如同往屆,黃仁勛對英偉達 AI 平台做了介紹,公布了其中的一系列重要進展,包括全新 Tesla V100 32GB GPU 的 2 倍內存、革命性的 NVSwitch 結構、以及全面的軟體堆棧推動性能提升、深度學習工作站 DGX-2 成為首款性能高達每秒 2 千萬億次浮點運算的深度學習系統、發布深度學習引擎 TensorRT 4 等。英偉達表示,相較於六個月前發布的上一代產品 DGX-1,其深度學習工作負載性能實現了 10 倍提升。

在大會上,黃仁勛宣布,新版的 Tesla V100 內存擴容了一倍。「5 年前 AlexNet 在 ImageNet 上展示了突破性的能力,」黃仁勛說道,「它有 8 層,數百個參數。而今天我們能夠看到數百層的神經網路,內含數十億參數,深度學習模型經過五年的發展,體量擴大了 500 倍。」

而這樣的計算需求可由「世界上最大的 GPU」DGX-2 進行處理,它是由 16 塊 32GB 內存的 Tesla V100 計算卡通過 NVSwitch 進行連接(顯卡間的通信速度是 PCI 的 20 倍,每秒 300Gbyte)所組成的,共擁有 2000TFPLOS 的 Tensor Core 算力,售價 39.9 萬美元。NVSwitch 是今天黃仁勛宣布的全新的 GPU 互聯結構。

DGX-2 是首款能夠提供每秒兩千萬億次浮點運算能力的單點伺服器,具有 300 台伺服器的深度學習處理能力,佔用 15 個數據中心機架空間,而體積則縮小 60 倍,能效提升 18 倍。

而後,黃仁勛宣布了英偉達在 AI 推理上的一系列動作。黃仁勛表示,基於在數據中心、汽車應 用、以及包括機器人和無人機等嵌入式設備領域中,諸如語音識別、自然語言處理、推薦系統、 以及圖像識別等新功能的支持,面向深度學習推理的 GPU 加速正在獲得越來越多的關注。

「我們需要超級計算機來幫助自己尋找更高效的能源存儲方法,探索地球的內部,預測未來的自然災害,以及模擬微觀世界的變化。」黃仁勛說道。

六、下一代DRIVE Orin自動駕駛晶元

黃仁勛在現場還展示了英偉達感知基礎(Perception Infrastructure)項目,這是一個大型的深度學習模型,能夠收集並分析不同感測器(如攝像機、雷達等等)得出的距離、天氣、雷達感知、高精地圖等等不同數據。

在接下來2-3年間,英偉達還將技術研發這一技術,直到最後能夠搭載在所有新車上。黃仁勛說,這是我們至今遇到的最為複雜的問題之一。

七、推出 DRIVE Constellation 模擬系統

自動駕駛一直是 GTC 大會的重要部分,今天,英偉達展示了一套用於使用照片級真實感模擬,基於雲的自動駕駛汽車測試系統。

該系統被稱為 NVIDIA DRIVE Constellation,是一種基於兩種不同伺服器的計算平台。第一台伺服器運行 NVIDIA DRIVE Sim 軟體,用以模擬自動駕駛汽車的感測器,如攝像頭、激光雷達和雷達。第二台伺服器搭載了 NVIDIA DRIVE Pegasus AI 汽車計算平台,可運行完整的自動駕駛汽車軟體堆棧,並能夠處理模擬數據,這些模擬數據如同來自路面行駛汽車上的感測器。

要實現自動駕駛汽車的量產部署,我們需要一種能夠在數十億英里的行駛中進行測試和驗證的解決方案,以實現足夠安全性和可靠性。黃仁勛介紹說,DRIVE Constellation 可以將視覺計算和數據中心方面的專業知識相結合以實現這一目標。藉助虛擬現實技術,測試者可通過對數十億英里的自定義場景和極端情況進行測試,從而提高演算法的穩定性,而花費的時間和成本僅為實際道路測試的一小部分。

八、聯合晶元巨頭ARM打造AI晶元專用IP

英偉達重磅宣布,將聯合晶元巨頭ARM打造AI晶元專用IP,這款IP屬於ARM幾年2月公布的Trillium項目的一部分,其技術源於英偉達Xavier晶元以及去年開源的DLA深度學習加速器項目。

英偉達本次宣布同ARM合作,將在數十億物聯網設備上實現深度學習。NVIDIA深度學習加速器IP將集成到Arm的Project Trillium平台中,以便於構建深度學習IoT晶元。

去年,英偉達也正式免費開源了完整版DLA(Deep Learning Accelerator,深度學習加速器),讓廠商可以免費下載使用,打造屬於自己的低功耗AI晶元(比如IoT晶元)。

今年2月,晶元巨頭ARM公布了其人工智慧項目Trillium,同時推出兩款專用IP,分別為物體檢測OD處理器和機器學習ML處理器。

ARM是全球智能設備第一大主流晶元架構提供商,全球超過90%的智能設備採用了ARM的晶元架構,包括手機、平板、手錶、電視、無人機等等。而英偉達,作為全球AI浪潮的引領者,能夠為人工智慧提供強大的計算力,二者一拍即合。

本次ARM牽手英偉達推出專用的IOT設備人工智慧IP,將會有助於人工智慧在終端設備廣泛鋪開,使得上億、甚至數十億台IOT設備都能夠用上低功耗、低成本的AI晶元,使物聯網晶元公司能夠輕鬆地將AI集成到它們的設計中,並幫助它們將智能且價格實惠的產品帶給全球數十億的消費者。

NVIDIA副總裁兼自主機器事業部總經理Deepu Talla表示:「推理將成為每個物聯網設備的核心能力。我們將與ARM一同推進這一趨勢的發展,幫助數百家晶元公司輕鬆採用深度學習技術。」

歡迎掃碼添加小編,加入人工智慧和大數據公眾號讀者交流群,探討、分享、交流!交流群每周會邀請行業專家進行在線分享!

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 IT大家談 的精彩文章:

肉體死亡,意識永存-AI讓人類永生?
微軟人工智慧繪圖機器人誕生,輸入文字既能生成圖片

TAG:IT大家談 |