當前位置:
首頁 > 新聞 > 專訪 Bill Dally:英偉達不擔心FPGA,也不怕ASIC新進對手

專訪 Bill Dally:英偉達不擔心FPGA,也不怕ASIC新進對手

身為全球最聰明的公司榜首,NVIDIA 不僅在由麻省理工科技評論主辦的 Emtech China 中發表了精彩的演說,會後主講者 NVIDIA 首席科學家 Bill Dally 也在專訪中向 DT 君揭露了 NVIDIA 目前在 GPU 產品、及相關計算生態的的布局。

NVIDIA 在 GeForce 256 晶元中增加了包括 Vertex Shader 以及 Pixel Shader 等可編程計算能力,並以 GPU 為相關繪圖晶元產品定名,顧名思義,GPU 是 Graphics Processor Unit,不像前代 RIVA 架構只能單純進行繪圖工作,GeForce256 的推出可說是重新定義其繪圖晶元產品,繪圖變成是其晶元功能的一部份,可編程的算力才是未來讓 NVIDIA 發光發熱的核心。

圖丨Bill Dally的簡介

不過往後數年,雖然具備了程序設計能力,但實際上於計算領域有所發揮也是 10 年後的事情。這是因為當時 NVIDIA 藉由成功的繪圖架構取得市場領先,且和 ATI 的市場大戰正火熱,流處理計算還沒有很好的應用之故,NVIDIA 也沒有意會 GPU 的算力未來會有如此龐大的潛力。2004 年,由 Bill Dally 帶領的斯坦福大學團隊針對 GPU 的可編程部分設計了許多流處理技術的計算架構,這些研究成果後來成為 CUDA 的基礎。

後來 NVIDIA 也以相關研究為基礎,推出通用並行計算架構 CUDA,以及針對計算應用的 Tesla 產品線。Bill Dally 對此可說是背後的重要推手之一。

在 2009 年,Bill Dally 加入 NVIDIA 後,NVIDIA 在 GPU 計算的腳步更是飛快發展。

圖丨Bill Dally在EmTech China上的演講

GPU 從原本在各大學中單純用來進行基礎科學研究的輔助角色,迅速成為各大超算、數據中心的計算核心,每年全球前五百大超算榜單之中採用 NVIDA 計算方案的幾乎都名列前茅。而配合 CUDA 生態的成熟,更從 2016 年大熱的AI 議題中,帶起了機器學習與深度學習的應用熱潮。

但是 GPU 在面對如此龐大的計算市場,以及此起彼落的挑戰者,是否還能維持榮景?Bill Dally 為深科技讀者帶來獨家的觀點。

DT 君:您可以簡單介紹目前 NVIDIA 的主力產品線嗎?

Bill Dally:我們實際上有四個方向同時進行,有四條產品線。其中包含了 GeForce、Quadro、Tesla 以及 Tegra。分別針對消費性圖形計算、專業圖形計算、專業高效能計算、以及嵌入式計算平台,基本上都是以 GPU 為共通的架構基礎,但針對不同應用進行微調,使之更適合不同的應用情境。

DT 君:針對 Volta 針對 AI 計算所做出的架構變革,比如說增加了 TensorCore,這會改變GPU 的定位嗎?

圖丨TesorCore架構

Bill Dally:TensorCore 是個營銷代號,其架構的真相就是增加一些相對應的指令集,藉由這些指令,讓 GPU 可做半精度 (Half- precision) 的矩陣乘積累積,而這是許多深度學習演算法所使用的的內部循環基礎邏輯。而且它實際上並沒有改變 GPU 的基本概念。Volta 仍然是一個貨真價實的 GPU,它在渲染圖形方面的性能表現仍是一流水平,加入 TensorCore 並沒有犧牲 GPU 本身的任何特性,反而是創造了雙贏。現在 Volta 可以更好的針對深度學習應用,同時也能發揮百之百的繪圖性能表現。

其實很多都是關於數據類型的選擇和指令的選擇。GPU 架構實際上是一個框架,你可以在其中放入不同的數據類型和不同的指令來完成不同的應用程序。比如說,開普勒架構對推理工作不能很好的支持,它也不具備半精度浮點計算能力。

當初數據型態的支持是深度學習的關鍵,而開普勒會使用 FP32,導致計算成本非常昂貴。從Pascal 我們開始支持推理計算以及 FP16 數據訓練計算能力,但你不會說 Pascal 因此就不是GPU 了。Volta 加入 TensorCore 也是類似的情形。

Volta 仍然是 GPU,可以做圖形計算。我認為GPU 是非常高效的並行計算架構。而我們並沒有犧牲任何其他的事情來做到這一點。

圖丨英偉達Volta

DT 君:所以我們仍然可以期待 TensorCore 可以在圖形任務中發揮功能嗎?

Bill Dally:是的,事實上,深度學習和圖形學之間有很大的協同作用,我們的發現是,通過深度學習,我們可以使圖形更好。然後進行視頻研究,開發圖像抗鋸齒和去噪的新演算法,並提供圖像的時間穩定性,這些都是基於深度學習。因此,通過擁有深厚的學習推理能力,晶元現在實際上在圖形表現方面會比沒有 TensorCore 更好。

DT 君:您如何看待在深度學習領域的挑戰者,比如說 FPGA?

Bill Dally:我不是很擔心 FPGA。如果你想解決某個問題,並且你願意投入大量的工程時間,那麼乾脆直接開發 ASIC 就好了。我是這麼看 FPGA 的,如果你在 ASIC 上設計了一個門,那麼把同一個門放在一個 FPGA 上,佔用的晶元面積和功耗都會是相差很多。

所以對於實際上你必須用隨機門工作的東西,FPGA 比 ASIC 要明顯更弱。FPGA 只能在 FPGA中使用大量硬體模塊的問題上做得很好。所以,如果你已經硬連接一些 FPGA 有 18 個 beta 算術單元來進行 DSP 操作,其他的有 14 個點單元。

當你不得不使用 FPGA 上的柵極時,它的表現會變得差強人意。也因此我們不認為它們是非常有競爭力的。

圖丨Tesla V100

DT 君:若 FPGA 並不是個值得擔憂的對手。那麼您會擔心什麼?

Bill Dally:有很多創業公司正在建立專門的深度學習晶元,我們當然也很關注這些發展。但是我的哲學總是「我們應該做我們認為可以做到最好的工作」,而他們的選擇基本限制了他們的發展空間,以致於不能做得更好,因為我們正在儘力做到最好。

如果我們以三個細分類別的方式細分深度學習的話,分別是訓練、推理和 IoT 設備的推理。

對於訓練,我們一直在做的是專註於深度學習的 GPU。所以如果你光是單純為了深度學習而建立一個晶元,那應用可能會過於狹窄,無法兼顧到其他可能的應用。而在我們的架構中,由於 HMMA 的操作,Volta 架構所集成的 TensorCore 可以做到很龐大的數學計算,它只需要一條指令即可完成 128 個浮點計算步驟,可以兼顧更多應用。

我們確實有一些對深度學習幫助不是那麼大的額外的晶元區塊,比如說針對圖形繪製工作的光柵化 (rasterization) 和紋理映射和合成 (texture mapping and compositing) 部分,但是這個部分並不大,若是構建一個專用晶元,他們的確可以擺脫一小部分晶元上的非計算必要區塊,理論上晶元成本會更有優勢。

雖然我們也可以這樣做,只是沒有任何商業意義,我們的想法是,最好是做一個晶元,並能夠做很多事情。不論是繪圖或者是用在數據中心,我們想要使用該晶元來盡量做到更多的事情。

圖丨正在參加EmTech圓桌的Bill Dally

DT 君:Emtech 大會上量子計算成為另一個熱點,那您怎麼看這件事?NVIDIA 有計划進行相關領域的開發計劃嗎?

Bill Dally:我們成立了一個研究小組,研究量子計算的進展觀察。從科學的角度來看,這是一個很有意思的領域。

近來人們已經取得了很大的進步,現在人們已經超過了 50 量子比特,並且維持量子態的時間可以做到更長。但是,對於一個可行的商業應用程序來說,仍然有數量級的需求。量子優勢在於,在量子計算機上運行的演算法,沒有辦法在傳統計算機上以相同的性能運行。

所以演算法的過程就是模擬量子計算機。但那並不重要。人們關心的是能夠運行模擬量子化學這樣的演算法,或者運行諸如將複合數字分解成兩個部落的演算法來破解編碼。這兩者所需的量子比特都是數千以上。所以我們離這個問題還有很遠的距離。

雖然我們認為量子計算還沒有到實用的地步,但我們仍非常仔細地關注相關技術的發展腳步,藉此避免發生我們無法掌握的變化。

DT 君:目前 NVIDIA 正積極打造自動駕駛平台,但汽車對功耗的控制其實相當重視,業界也都提出不少競爭產品,您怎麼看現有的方案?

Bill Dally:我們實際上提供的不僅僅是架構,也同時為自動駕駛汽車提供完整的解決方案。比如說基於 Xavier 架構的 Drive PX。這是最有效的計算平台,我的意思是,其 30 Tera Ops 的深度學習性能僅需要 10 瓦左右的功耗,所以每瓦計算能力超過 3 Teraflops。而 DLA 中的部分是每瓦特超過 4 Teraflops。所以這是一個效率非常高的平台。

最重要的是,作為 Drive PX 系統的一部分,我們有一個完整的軟體平台,包括用於感知的神經網路,相機和激光雷達以及雷達,然後是用於路徑規劃和控制的軟體車輛。

我們自己測試車隊的自動駕駛汽車已經完全運行 NVIDIA 軟體。我們也向汽車廠商提供該硬體和該軟體。我們在車裡也有一個以前叫做 Co-Pilot 的軟體,現在重新命名為 Drive IX,它的主要功能就是監視著司機,它有眼睛跟蹤和頭部跟蹤,它要是看到司機心不在焉,或過度勞累就可要求汽車做出適度警示。它有手勢識別,所以你可以用手勢來控制汽車。我們同時也為汽車製造商提供完整的自動駕駛解決方案。我認為這是業界目前能獲得最具競爭力的解決方案。

DT 君:您看來不是很擔心來自業界的競爭?

Bill Dally:我總是擔心我們的競爭對手。但是我們的理念是向前看,而不是頻頻回頭,所以我們是領先的,我們想要做的就是弄清楚我們如何能夠儘可能高效地運行,不論是市場策略或產品架構。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 DeepTech深科技 的精彩文章:

MIT Media Lab數字貨幣研究主任:區塊鏈將迎來「眾神共存」
英特爾布局CPU以外計算架構策略收效,PC市場雖續冷但整體營收仍優

TAG:DeepTech深科技 |