當前位置:
首頁 > 科技 > AI晶元如果有「羅馬大道」,必定歸功可重構計算

AI晶元如果有「羅馬大道」,必定歸功可重構計算

在晶元架構設計領域中,可重構計算技術並非一項新的存在。20世紀60年代末,加利福尼亞大學的Geraid Estrin首次提出重構計算,後過去二十餘年,Xilinx才基於這一原型系統推出該技術的重要分支——FPGA架構,正式開啟現代重構計算技術。

即便如此,由於此前晶元發展一直走在摩爾定律預設的方向上,FPGA始終無法進入公眾的視野中,而在學術研究領域,它也一直只是晶元技術研究中少有人關注的冷門項目。不曾想,在這一波AI浪潮的推動下,可重構計算技術迅速從學術邊緣走向了主流。


AI浪潮與晶元架構創新

任何技術的興起都是市場需求、技術迭代與產業發展合力推動的結果,AI不例外,晶元的變革更是如此。

在算力需求持續增長的背景下,AI演算法對晶元運算能力的要求上升到傳統晶元的百倍以上,想像一下,採用了人工智慧演算法的AlphaGo需要用到上千塊傳統處理器(CPU)和上百塊圖形處理器(GPU)。類似,傳統處理器根本無力支持智能家居、自動駕駛和智能終端等應用場景的巨大算力需求,因此基於傳統CPU搭建出新的架構就顯得迫在眉睫,AI晶元也就此誕生。

對於這一新興的晶元市場,摩根大通的分析師Harlan Sur曾公開表示,到2022年為止,AI晶元市場將以每年59%的成長速度增長,屆時市場規模有望達到330億美元。

用迅猛之勢來形容AI晶元產業的發展毫不為過,這一新興事物也打破了整個市場既有的產業形態。在新興晶元市場佔據龍頭地位的英偉達,其CEO黃仁勛就多次在公開場合中表示:「摩爾定律時代已經終結。」這也並非一家之言,作為摩爾定律的提出者,Intel也多次公開承認這一點。

沒有摩爾定律的約束,在接下來很長一段時間內,晶元產業勢必將進入自由生長狀態,AI晶元產業呈現了前所未有的百花齊放。但其實深入去看,它卻也被有章法的推進著。事實上,最為明顯的就是,伴隨著整個市場對功能的需求變化和終端的發展,GPU、ASIC等主流晶元架構技術正逐步有序得的迭代和擴大自己的市場佔比。

目前,因市場對智能的實現尚處於初期,AI中關鍵的應用需求更偏向於訓練端,因而,在訓練市場中獨大的GPU成為晶元市場的主流架構也就毫不奇怪。但真正的智能一定離不開邏輯推理部分。自然,作為這一功能實現的主力軍,ASIC和FPGA備受業內關注,其中,熱度蹭蹭上漲的FPGA可以說是格外引入注目。


FPGA熱潮啟示錄

在AI並不火熱的時間段,FPGA常年來被用作專用晶元(ASIC)的小批量替代品。因傳統計算機馮·諾依曼結構的約束,比CPU甚至GPU能效更高的FPGA一直未有用武之地,直到神經網路演算法的出現。

不得不說,從初入商用市場到獨立成產品,FPGA架構技術似乎從未和AI演算法分離開過,硬體上的節點與演算法的神經元結構形成天然的呼應,頗有天造地設的意味。

如所料,FPGA最早一出現就伴隨著神經網路演算法研究,2011年,Altera推出OpenCL,其中的CNN演算法研究就是基於FPGA的,這讓FPGA重回了人們的視野中;後時隔三年,微軟推出Catapult項目,開發了高吞吐CNN FPGA加速器,將這種架構更緊密的與神經網路演算法實現綁在了一起;2015年,陷入轉型焦慮的Intel直接選擇收購Altera,這一舉動後來甚至帶起了一波CPU+FPGA熱,但這一刻FPGA的魅力還沒有真正被展現出來。直到一年後,Intel終利用BP演算法在FPGA上實現了5GOPS處理能力,這一架構的優勢終鋒芒初現。

一步一步,伴隨著深度學習的應用和滲透,FPGA架構技術也越來越受各晶元廠商關注,在多次大會的行業交流中,多位晶元研發人員都指出:綜合考慮成本、可行性等因素,在可見的未來里,架構創新是唯一算力提升解決方案。而FPGA無疑為整個行業帶來架構設計上的新思路。

第一次,FPGA被用於產品端是在iPhone 7上,蘋果集成了Lattice iCE40 FPGA,將其作為超低功耗的邏輯處理兼感測器部件。從技術到產品端,這一技術架構只用了短短七年,而蘋果的成功嘗試也為這一技術架構加分不少。現在,業內人士也普遍將它列為舊有半導體甚至終端架構的關鍵顛覆者,也因此,FPGA這七年的持續熱度給出了整個行業的風向標:半導體架構進入了新的征程,尤其為AI晶元的設計提供了關鍵思路。


站在FPGA的肩膀上,可重構晶元誕生

對於AI晶元的優勢,寒武紀陳天石曾這樣形象的描述道:「如果把深度學習看作切肉,傳統的處理器就是瑞士軍刀,我們的專用神經網路處理器則相當於菜刀。瑞士軍刀通用性很好,什麼都可以干,但幹得不快,菜刀是專門用來做飯的,在切肉這件事情上,效率當然更高。」

按理,效率越高,算力越高,晶元產業發展應當重回到此前活躍增長的階段,但在近兩年整個產業卻出現了一種怪象:晶元產業進入了一種低效的繁榮狀態,現有的AI產品的數量只有兩位數,而單價幾乎不變,尤其是AI終端產品,產業利潤幾乎在個位數。在產業鏈端,產品開發費用、產品難度都在持續上升,在市場空間有限的條件下,產品的盈利空間直線下降。

事實上,僅僅融合FPGA架構設計的高效對整個產業的發展來說是依然不夠的,菜刀終究還是菜刀,AI晶元的應用場景和變現能力實在十分有限。對此,清華大學微電子所所長魏少軍就直接點出:「要想讓AI晶元能夠在使用中變得更『聰明』,架構創新就是它不可迴避的課題。」

產業端,為了打破這一現狀,地平線、寒武紀、Arm等眾多新老玩家紛紛給出了各自的平台性商用解決方案,但終不是長久之計。對此,業內的共同認知是:若想釜底抽薪,設計出一款動態可重構的並行計算晶元,以實現一塊晶元可以跑多種演算法,節省資源,大大提高通用性,極大程度上促進整個產業的發展。

所幸,在國內,目前尚有兩款晶元代表:一款是清華大學的Thinker可重構AI晶元,它獲得了2017年國際低功耗電子與設計會議設計競賽獎,這是一款由65nm工藝製成的晶元,不過其峰值性能能夠達到410GOPS,能效達5TOPS/W。第二款是南京大學RAPS可重構晶元,它由40nm工藝製成,可以實現25種與信號處理有關的演算法,峰值性能69GFLOPS,能效達到32GFOPS/W。與TMS320C6672多核DSP比較,性能能夠提高一個數量級。

值得一提的是,兩款晶元製程一般,工藝泛泛,卻收穫如此高效的性能,架構創新的四兩撥千斤功效可見一斑。


最後

縱觀第三波AI浪潮下的半導體產業,有兩個現象級事件奠定了當下晶元產業的基調:曾經逃離半導體行業的風投又紛紛重新回到了半導體行業;歷來觀潮的中國,現在成了弄潮兒。

不言而喻,這兩大趨勢撞在一起發生的化學效應率先打破了整個半導體行業既有的產業形態。但不可忽視的是,作為工業的糧食,晶元架構創新帶動的產業活力才將成為推動第三波AI浪潮持久發展的動力。

如許衍居院士所言:未來10年,整個半導體產業將會從cSoC時代走向rSoC時代。但是可重構晶元發展還需要突破眾多難關,如基於可重構計算搭建的硬體平台是需要搭建一個統一的標準平台還是僅僅只開發一個通用的編程模型?採用雙編程如何劃分軟硬體任務並處理好之間的通信問題?這些問題依舊是纏繞在可重構晶元發展之路上的藤蔓,披荊斬棘,路且漫長。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 鎂客網 的精彩文章:

嘩眾取寵還是確有其事?基因編輯嬰兒背後疑點重重
自動駕駛賽道超車,關鍵是補「芯」

TAG:鎂客網 |