當前位置:
首頁 > 科技 > FPGA與ASIC的完美結合,Achronix Speedster 7t系列詳解

FPGA與ASIC的完美結合,Achronix Speedster 7t系列詳解

摘要:為了進一步滿足人工智慧/機器學習(AI/ML)和高帶寬數據加速應用日益增長的需求,今年5月,Achronix公司推出了創新性的、全新的FPGA系列產品——Speedster 7t系列。Speedster 7t系列是基於一種高度優化的全新架構,以其所具有的如同ASIC一樣的性能、可簡化設計的FPGA靈活性和增強功能,從而遠遠超越傳統的FPGA解決方案。

提起FPGA,可能很多人第一時間都會想到FPGA大廠賽靈思和Altera(已經被英特爾收購),然而其實還有其他的一些非常有特色的FPGA廠商,比如基於FPGA的硬體加速器件和高性能嵌入式FPGA(eFPGA)半導體知識產權(IP)公司Achronix。

得益於近年來人工智慧/機器學習的快速發展,新的演算法不斷的出現,這推動了可編程的FPGA市場的快速增長。根據市場調研公司Semico Research的預測,AI應用中FPGA的市場規模將在未來4年內增長3倍,達到52億美元。

根據市場研究機構IP Nest近期發布的最新的IP市場分析報告顯示,Achronix是2018年全球增速最快的IP提供商,同比增長達到了250%,足見Achronix業務增長之迅速。

而為了進一步滿足人工智慧/機器學習(AI/ML)和高帶寬數據加速應用日益增長的需求,今年5月,Achronix公司推出了創新性的、全新的FPGA系列產品——Speedster 7t系列。

全新架構:ASIC和FPGA的完美結合

我們都知道,對於AI加速來說,相較於我們常見的CPU、GPU等通用型晶元以及可編程的FPGA來說,ASIC晶元的計算能力和計算效率都直接根據特定的演算法的需要進行定製的,所以其可以實現體積小、功耗低、高可靠性、保密性強、計算性能高、計算效率高等優勢。所以,在其所針對的特定的應用領域,ASIC晶元的能效表現要遠超CPU、GPU等通用型晶元以及可編程的FPGA。

但是,正如我們前面所提及的是,目前AI演算法仍然處在一個不斷的快速更新迭代的階段,數值精度的可選擇性也越來越多。同時隨著AI的應用場景快速發展演進,新的解決方案都要去應對在高性能、靈活和上市時間等方面的不同需求。

而AISC是針對特定的演算法加速所設計的,這也使得其在靈活性上遠不如可通過編程快速適應新的軟體演算法的FPGA。但是,FPGA在體積、能效、成本上卻又不如AISC。那麼是否能夠有這樣一款產品,能夠很好的將FPGA和ASIC的優點結合在一起呢?Achronix的Speedster 7t系列或許就是這樣一款產品。

Achronix稱,Speedster 7t系列是基於一種高度優化的全新架構,以其所具有的如同ASIC一樣的性能、可簡化設計的FPGA靈活性和增強功能,從而遠遠超越傳統的FPGA解決方案。

Achronix Semiconductor總裁兼首席執行官Robert Blake表示:「Speedster7t是Achronix歷史上最令人激動的發布,代表了建立在四個架構代系的硬體和軟體開發基礎上的創新和積澱,以及與我們領先客戶之間的密切合作。Speedster7t是靈活的FPGA技術與ASIC核心效率的融合,從而提供了一個全新的『FPGA 』晶元品類,它們可以將高性能技術的極限大大提升。」

Speedster7t FPGA系列詳解

根據Achronix的介紹來看,Speedster7t FPGA系列產品是專為高帶寬應用進行設計的,其具有一個革命性的全新二維片上網路(2D NoC,Network on Chip),以及一個高密度全新機器學習處理器(MLP)模塊陣列。通過將FPGA的可編程性與ASIC的布線結構和計算引擎完美地結合在一起,Speedster7t系列產品創造了一類全新的「FPGA 」技術。

同時,Speedster7t系列產品還包括了高帶寬GDDR6介面、400G乙太網埠和PCI Express Gen5等介面,所有這一切單元都互相連接以提供ASIC級帶寬,同時保留FPGA的完全可編程性。

而為了應對接收來自多個高速來源的大量數據,同時還需要將那些數據分發到可編程片上演算法性和處理性單元中,然後以儘可能低的延遲來提供那些結果,所以在製程工藝上,Speedster7t器件選擇了採用台積電最新的7nm FinFET工藝製造。

全新機器學習處理器陣列

對於傳統的帶DSP模塊的FPGA來說,其所能夠提供的AI性能是相對有限的,因為使用DSP模塊只能提供不高效的數值精度支持,使用外部LUT和內存構建AI/ML應用程序,需要消除額外邏輯編輯和內存資源,性能也受FPGA布線限制。

相比之下,Speedster7t FPGA則採用了全新機器學習處理器(MLP)中大規模的可編程計算單元平行陣列,它們可提供業界最高的、基於FPGA的計算密度。MLP是高度可配置的、計算密集型的單元模塊,每個MAC單元支持最多32個乘法器,可驅動可變精度加法器/累加器,可支持4到24位的整點格式和高效的浮點模式,包括對TensorFlow的16位格式的支持,以及可使每個MLP的計算引擎加倍的增壓塊浮點格式的直接支持。

另外,每個MLP當中還緊密耦合了內存區塊,包括72K bits的RAM和2K bits的寄存器。這種運算和存儲級鏈接,使得MLP在不需要使用FPGA布線資源的情況下,實現更複雜的AI演算法。

此外,MLP還與嵌入式存儲器模塊緊密相鄰,通過消除傳統設計中與FPGA布線相關的延遲,來確保以750 MHz的最高性能將數據傳送到MLP。

這種高密度計算和高性能數據傳輸的結合使得處理器邏輯陣列能夠提供基於FPGA的最高可用計算能力以每秒萬億次運算數量為單位(TOPS,Tera-Operations Per Second)。

超高吞吐量的內存帶寬和介面

高性能計算和機器學習系統的關鍵之處是高片外存儲器帶寬,從而為多個數據流提供存儲源和緩衝。 Speedster7t器件是唯一支持GDDR6存儲器的FPGA,該類存儲器是具有最高帶寬的外部存儲器件。每個GDDR6存儲控制器都能夠支持512 Gbps的帶寬,Speedster7t器件中有多達8個GDDR6控制器,可以支持4 Tbps的GDDR6累加帶寬,並且以很小的成本就可提供與基於HBM的FPGA等效存儲帶寬。

「美光(Micron)樂於攜手Achronix去實現全球第一個面向高帶寬存儲需求而直接載入了GDDR6的FPGA產品,」美光計算與聯網業務部營銷副總裁Mal Humphrey。「像這樣的創新的和可擴展的解決方案將推動人工智慧領域內的差異化,其中異構計算可選方案與高性能的存儲是加速獲得數據內涵的必需部分。」

除了這種超高吞吐量的存儲帶寬,Speedster7t器件還包括業界最高性能的介面埠,以支持極高帶寬的數據流。Speedster7t器件擁有多達72個業界最高性能的SerDes,可以達到1到112 Gbps的速度。還有帶有前向糾錯(FEC)的硬體400G乙太網MAC,支持4x 100G和8x 50G的配置,以及每個控制器有8個或16個通道的硬體PCI Express Gen5控制器。

「Achronix全新的Speedster7t FPGA系列產品是創新性晶元架構實現爆發的一個卓越案例,創造該架構的目的是直接面向AI應用處理大量的數據,」 Semico Research公司ASIC和SoC首席市場分析師Rich Wawrzyniak說道。「通過將數學函數、存儲器和可編程性整合到其機器學習處理器中,再結合交叉晶元、二維NoC結構,從而形成了消除瓶頸和確保整個器件中數據自由流動的絕佳方法。在AI / ML應用中,內存帶寬就是一切,Achronix的Speedster7t在這一領域提供了令人印象深刻的性能指標。」

全新二維片上網路:提供超高效率的數據移動

來自Speedster7t高速I/O和存儲器埠的數萬兆比特數據量非常的大,傳統的FPGA面向比特位的可編程互連邏輯陣列的路由容量已不能滿足需求,因此Speedster7t架構提供了一個可橫跨和垂直跨越FPGA邏輯陣列的創新性的、高帶寬的二維片上網路(NOC)。

這個2D NOC可連接到所有FPGA的高速數據和存儲器介面。它們就像疊加在FPGA互連這個城市街道系統上的空中高速公路網路一樣,Speedster7t的NoC支持片上處理引擎之間所需的高帶寬通信。NoC中的每一行或每一列都可作為兩個256位實現,單向的、行業標準的AXI通道,工作頻率為2GHz,同時可為每個方向提供512 Gbps的數據流量。

通過在Speedster中實現專用2D NoC, 極大地簡化了高速數據移動,並確保數據流可以輕鬆地定向到整個FPGA結構中的任何自定義處理引擎。最重要的是,NOC消除了傳統FPGA使用可編程路由和邏輯查找表資源在整個FPGA中移動數據流中出現的擁塞和性能瓶頸。這種高性能網路不僅可以提高Speedster7t FPGA的總帶寬容量,還可以在降低功耗的同時提高有效LUT容量。

以400G乙太網匯流排帶寬操作所需頻率為例,傳統FPGA的最佳方案是匯流排大小為1024 bits,但是需要的頻率要達到724MHz,這在傳統的FPGA中是不可能實現的。顯然,對於任何400G乙太網匯流排帶寬,傳統的FPGA運行速度都不夠快。

相比之下,Speedster7t FPGA則可以通過2D NOC以四個256bits的匯流排以506MHz的工作頻率來實現。

針對安全性至上和硬體確保應用的安全防護功能

Speedster7t FPGA系列產品在面臨第三方攻擊的威脅時,可用最先進的比特流安全保護功能應對,它們具有的多層防禦能力可保護比特流的保密性和完整性。密鑰是基於防篡改物理不可克隆技術(PUF)進行加密,比特流由256位的AES-GCM加密演算法進行加密和驗證。為了防止來自旁側信道的攻擊,比特流被分段,每個數據段使用單獨導出的密鑰,且解密硬體採用差分功率分析(DPA)計數器措施。 此外,2048位RSA公鑰認證協議被用來激活解密和認證硬體。用戶可以確信的是當他們載入其安全比特流時,它是預期的配置,這是因為它已通過RSA公鑰、AES-GCM私鑰和CRC校驗進行了身份驗證。

四款Speedster7t FPGA系列產品

Speedster7t FPGA系列目前共有4款產品,器件的大小範圍為從363K至2.6M 的6輸入查找表(LUT)。

在具體的性能指標方面,Achronix透露,Speedster7t FPGA系列種最強的7t1500,在其最高頻率750MHz,80%利用率,每個MLP區塊支持16×Int8運算的情況下,在ResNet-50訓練模型下,可以實現高達8600張/秒的圖像識別能力;而在Yolov2的演算法之下,7t1500亦可實現1600張/秒的圖像識別能力。

據Achronix CEORobert Blake介紹,支持所有Achronix產品的ACE設計工具現已可提供,可支持包括Speedcore eFPGA和SpeedchipFPGA多晶粒封裝晶元(Chiplet)。第一批用於評估的Speedster7t FPGA系列器件和開發板將於2019年第四季度提供。

小結:

從前面的介紹,我們不難看出,Speedster 7t系列FPGA,主要是通過其全新二維片上網路,以及高密度全新機器學習處理器模塊陣列,實現了將FPGA的可編程性與ASIC的布線結構和計算引擎完美地結合在一起。而這與去年賽靈思推出的全新的ACAP架構也有著異曲同工之處。

需要指出的是,Achronix是目前唯一一家既提供獨立FPGA晶元又提供Speedcore嵌入式FPGA(eFPGA)半導體知識產權( IP)的公司。也就是說,晶元設計廠商可以通過購買授權的形式,將Achronix的Speedcore嵌入式FPGA(eFPGA)的IP整合到自己的晶元設計當中,設計出符合自身需求的晶元。

而Achronix在Speedcore eFPGA IP中採用了與Speedster7t FPGA中使用的同一種技術,可支持從Speedster7t FPGA到ASIC的無縫轉換。這也意味著晶元設計廠商通過與Achronix合作,也可以獲得最新的Speedster7t FPGA系列的技術,並可將其轉換為ASIC。Achronix CEORobert Blake表示,該技術有望幫助客戶節省高達50%的功耗並降低90%的成本。

編輯:芯智訊-浪客劍

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 芯智訊 的精彩文章:

華虹無錫12英寸產線首批光刻機順利進場,9月將試產

TAG:芯智訊 |