當前位置:
首頁 > 科技 > 中國「芯」為智能時代賦能,高速DDR存儲器突破「內存牆」

中國「芯」為智能時代賦能,高速DDR存儲器突破「內存牆」

AI、5G、自動駕駛、大數據、海量存儲,數字革命帶來的智能時代已經到來,精彩紛呈的智能化、數字化技術連接無限可能的未來。


AI亟需高能效計算和高帶寬數據技術

這是一個信息爆炸的大數據時代,對超高速、高帶寬、大容量、高密度、低功耗和低成本的超高性能計算需求呈爆髮式增長,而人工智慧的出現更加速了這種趨勢,因為它需要大量的數據進行訓練。

面對滾滾而來的數據洪流,要使通過AIoT設備傳輸的大量數據變得有用,無論是採用本地處理、實時處理還是雲端處理,高效靈活的計算平台、高性能存儲和複雜但易於使用的機器學習堆棧,都是大數據/人工智慧取得突破性成果的關鍵,三個元素缺一不可。

(a)AI晶元中的馮·諾依曼「瓶頸」(b)內存層級結構

眾所周知,演算法(Algorithm)、數據(Big data)和計算能力(Computing)並稱為新AI時代三大驅動力,AI在追求更好性能的同時要實現低功耗、低延遲和低成本,這就亟需高能效計算和高帶寬數據技術。


高帶寬高能效成為高性能計算核心瓶頸

在傳統計算設備廣泛採用的馮·諾依曼架構中,計算和存儲功能不但是分離的,而且更側重於計算。一方面,處理器和存儲器分離的體系架構,使得數據需要在處理器和存儲器之間不停的來回傳輸,消耗了約80%的時間和功耗。另一方面,處理器和存儲器二者之間長期以來所採用的不同工藝路線,也是造成計算和存儲分離,繼而產生「存儲牆」和「功耗牆」問題的重要原因之一。

傳統的馮·諾依曼計算架構

但現實應用中,用戶對處理器的高性能需求是無止境的,這使得半導體廠商不斷通過提高晶體管內部的開關速度、使用更多的金屬布線層和先進封裝技術等手段來提升性能;而與此同時,對於存儲器來說,消費者和廠商更在意的是如何在更小的存儲單元面積上獲得更多的晶體管數量,用以增加存儲密度,擴大存儲容量。據相關數據現實,1980-2000年處理器和存儲器兩者的速度失配以每年50%的速率在增加。

1980-2000年,處理器和存儲器兩者的速度失配以每年50%的速率增加

與此同時,數據遷移需要的功耗在整個計算中的佔比也在「水漲船高」。有研究顯示,7nm工藝時代,訪存功耗達到25pJ/bit(45.5%),通信功耗達到10pJ/bit(18.2%),數據傳輸和訪問功耗佔比達到了63.7%。所以說,高帶寬高能效成為高性能計算核心瓶頸,在這一克服過程中,計算單元優化定製、GDDR6/LPDDR4,HBM, Serdes高帶寬存儲技術將扮演重要角色。

突破「內存牆」:高速DDRn存儲器介面技術趨勢

基於數據和視頻的並行計算需求正在急劇增大,對系統內存的帶寬頻來了更大的渴求,也給產業界提出了更多挑戰:儘可能實現近數據存儲計算(Near Memory Compute),或者是最好能夠將存儲和計算有機地結合在一起(存儲器顆粒本身的演算法嵌入),直接利用存儲單元進行計算,最大程度的消除數據遷移所帶來的功耗開銷。

作為國內IP市場連續10年領先的中國晶元IP和晶元定製的一站式領軍企業,2018年,芯動科技(INNOSILICON)在全球範圍內率先攻克頂級難度的GDDR6高帶寬數據瓶頸,並量產性能領先的加密計算GPU;率先掌握0.35V以下近閾值電壓低功耗計算技術;提供市場上最快的AI存儲加速晶元,使SOC數據的存儲帶寬增加四倍以上,支持高性能國產CPU/GPU/NPU等各種HPC應用場景。

與此同時,芯動科技推出的DDR系列內存產品也始終處於行業前沿,涵蓋高性能產品GDDR6(16GT/s, 1.35V)、主流產品DDR5(6.4GT/s, 1.1V)、低功耗產品LPDDR5(6.4GT/s, 0.5V)等。

突破「內存牆」:高速DDRn存儲器介面技術趨勢

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!