2017年全球及中國人工智慧晶元行業前景研究報告
一、人工智慧的高速發展催生AI晶元
隨著大數據的發展,計算能力的提升,人工智慧近兩年迎來了新一輪的爆發。而人工智慧的實現依賴三個要素:演算法是核心,硬體和數據是基礎,晶元就是硬體的最重要組成部分。它其實包括兩個計算過程:1、訓練(Train);2、應用(Inference)。
為什麼需要人工智慧晶元?神經網路演算法應用的不斷發展,使得傳統的CPU已經無法負擔幾何級增長的計算量。深度學習作為機器學習的分支,是當前人工智慧研究的主流方式。簡單說就是用數學方法模擬人腦神經網路,用大量數據訓練機器來模擬人腦學習過程,其本質是把傳統演算法問題轉化為數據和計算問題。所以對底層基礎晶元的要求也發生了根本性改變:人工智慧晶元的設計目的不是為了執行指令,而是為了大量數據訓練和應用的計算。
AI晶元的誕生之路
資料來源:公開資料整理
二、人工智慧晶元三種技術路線分析
目前適合深度學習的人工智慧晶元主要有GPU、FPGA、ASIC三種技術路線。三類晶元代表分別有英偉達(NVIDIA)的Tesla系列GPU、賽靈思(Xilinx)的FPGA和Google的TPU。GPU最先被引入深度學習,技術最為成熟;FPGA具有硬體可編程特點,性能出眾但壁壘高。ASCI由於可定製、低成本是未來終端應用的趨勢。
1、DPU
GPU使用SIMD(單指令多數據流)來讓多個執行單元以同樣的步伐來處理不同的數據,原本用於處理圖像數據,但其離散化和分散式的特徵,以及用矩陣運算替代布爾運算適合處理深度學習所需要的非線性離散數據。作為加速器的使用,可以實現深度學習演算法。
GPU由並行計算單元和控制單元以及存儲單元構成GPU擁有大量的核(多達幾千個核)和大量的高速內存,擅長做類似圖像處理的並行計算,以矩陣的分散式形式來實現計算。同CPU不同的是,GPU的計算單元明顯增多,特別適合大規模並行計算。
GPU與CPU的比較
資料來源:中商產業研究院
2、FPGA
FPGA是用於解決專用集成電路的一種方案。專用集成電路是為特定用戶或特定電子系統製作的集成電路。人工智慧演算法所需要的複雜並行電路的設計思路適合用FPGA實現。FPGA計算晶元布滿「邏輯單元陣列」,內部包括可配置邏輯模塊,輸入輸出模塊和內部連線三個部分,相互之間既可實現組合邏輯功能又可實現時序邏輯功能的獨立基本邏輯單元。
FPGA相對於CPU與GPU有明顯的能耗優勢,主要有兩個原因。首先,在FPGA中沒有取指令與指令解碼操作,在Intel的CPU裡面,由於使用的是CISC架構,僅僅解碼就占整個晶元能耗的50%;在GPU裡面,取指令與解碼也消耗了10%~20%的能耗。其次,FPGA的主頻比CPU與GPU低很多,通常CPU與GPU都在1GHz到3GHz之間,而FPGA的主頻一般在500MHz以下。如此大的頻率差使得FPGA消耗的能耗遠低於CPU與GPU。
3、ASIC
ASIC(專用定製晶元)是為實現特定要求而定製的晶元,具有功耗低、可靠性高、性能高、體積小等優點,但不可編程,可擴展性不及FPGA,尤其適合高性能/低功耗的移動端。
目前,VPU和TPU都是基於ASIC架構的設計。針對圖像和語音這兩方面的人工智慧定製晶元,目前主要有專用於圖像處理的VPU,以及針對語音識別的FAGA和TPU晶元。
圖像應用和語音應用人工智慧定製晶元
資料來源:中商產業研究院
三、全球人工智慧晶元行業發展現狀
1、全球人工智慧晶元行業規模分析
2016年人工智慧晶元市場規模達到6億美金,預計到2022年將達到60億美金,年複合增長率達到46.7%,增長迅猛,發展空間巨大。
數據來源:中商產業研究院
2、全球人工智慧晶元行業格局分析
2016年成為晶元企業和互聯網巨頭們在晶元領域全面展開部署的一年。而在這其中,英偉達保持著絕對的領先地位。但隨著包括谷歌、臉書、微軟、亞馬遜以及百度在內的巨頭相繼加入決戰,人工智慧領域未來的格局如何,仍然待解。
從雲端晶元來看,目前GPU佔據雲端人工智慧主導市場,占人工智慧晶元市場份額的35%。而在這其中,GPU的領跑者英偉達(Nvidia)因其在人工智慧領域的優勢使其成為了資本市場的絕對寵兒:在過去的一年中,曾經以遊戲晶元見長的Nvidia股價從十幾年的穩居30美元迅速飆升至120美元。據悉,世界上目前約有3000多家AI初創公司,大部分都採用了Nvidia提供的硬體平台。
互聯網和晶元行業巨頭紛紛布局AI晶元領域
資料來源:公開資料整理
3、FPGA潛力被低估了,未來大有可為
演算法正向有利於FPGA發展的方向迭代。模型壓縮是從訓練環節走向推理環節的必要過程。深鑒科技在將LSTM模型的尺寸壓縮20倍後,採用了搭建在FPGA上的硬體框架ESE,獲得了高一個數量級的能量效率提升。能量效率分別為CPU的40倍和GPU的11.5倍。
FPGA受益於晶元NRE費用指數級上升帶來的規模效應。隨著製程工藝不斷提高,晶元NRE費用指數級上升,越來越多的ASIC晶元將由於達不到規模經濟而被迫放棄,從而轉向直接基於FPGA開發設計。
四、中國人工智慧晶元行業發展現狀
1、我國人工智慧晶元行業正處於起步階段
目前,我國的人工智慧晶元行業發展尚處於起步階段。華為在2017年德國柏林國際消費類電子產品展覽會發布華為首款人工智慧(AI)移動計算平台——麒麟970,是業界首顆帶有獨立NPU(神經網路單元)的手機晶元,是華為人工智慧的重要里程碑,也是中國晶元設計行業的重要里程碑。
2、我國人工智慧晶元行業規模分析
隨著大數據的發展,計算能力的提升,人工智慧近兩年迎來了新一輪的爆發。晶元約佔人工智慧比重的15%,結合我國人工智慧市場規模,推算出2016年我國人工智慧晶元市場規模約為20億元。
數據來源:中商產業研究院
3、我國人工智慧晶元行業區域發展分析
據工信部統計,中國北上深三座城市的人工智慧相關企業總數達447家,攀升速度迅猛。目前,幾乎所有互聯網企業的互聯網產品,都會或多或少加入演算法和深度學習的功能,AI正在成為中國互聯網公司的標配。
資料來源:中商產業研究院
五、科技巨頭紛紛布局人工智慧晶元領域
全球科技巨頭都在加緊布局AI晶元,希望走在科技變革時代的前線。
NVIDIA是AI晶元的市場領先者,佔據了全球GPU70%的市場份額;Intel接連收購Altera、Nervana、Movidius,全方位布局AI產品;Google發布兩代TPU,從ASIC方向進軍AI晶元市場;寒武紀科技是中科院計算所孵化的一家獨角獸公司。2016年推出了國際首個深度學習專用處理器晶元(NPU),技術全球領先。
1、NVIDIA:GPU龍頭,AI晶元的市場領先者
目前全球GPU行業的市場份額有超過70%被英偉達公司佔據。而應用在人工智慧領域的可進行通用計算的GPU市場則基本被英偉達公司壟斷。
自1999年發布第一款GPU以來,GPU就成為了英偉達最為核心的產品,佔到了英偉達總營業收入的八成以上。英偉達的股價表現也是十分驚人,2016年英偉達的股價上漲了228%,過去的5年內累計上漲500%。
目前英偉達GPU晶元主要應用方向為數據中心晶元、自動駕駛晶元和嵌入式晶元。主要包括採用Pascal架構的TeslaP100和TeslaP10晶元、採用Volta架構的DGX-1晶元、自動駕駛的DriverPX2晶元、JetsonTX2晶元等。
GPU晶元構成公司最主要收入來源,2017年上半年,GPU貢獻收入34.59億美元,占公司總收入的83%;TegraProcessor貢獻收入6.65億美元,佔比16%,其他部分貢獻收入1%。
數據來源:中商產業研究院
2、Intel:全領域布局人工智慧產品
2015年,英特爾以167億美元收購了FPGA製造商Altera。英特爾斥巨資收購Altera不是來為FPGA技術發展做貢獻的,而是要讓FPGA技術為英特爾的發展做貢獻。
2016年8月,Intel宣布收購創業公司NervanaSystems。Nervana準備推出深度學習定製晶元NervanaEngine,相比GPU在訓練方面可以提升10倍性能。與TeslaP100類似,該晶元也利用16-bit半精度浮點計算單元和大容量高帶寬內存(HBM,計劃為32GB,是競品P100的兩倍),摒棄了大量深度學習不需要的通用計算單元。
Intel人工智慧布局
料來源:公開資料整理
3、Google:發布兩代TPU,從ASIC方向進軍AI晶元市場
第一代TPU展現出ASIC在神經網路推斷方面的優秀性能。谷歌在2016年的I/O大會上推出了自己的AI晶元——張量處理器TPU(第一代)。
第二代TPU兼具推理+訓練。2017年5月I/O大會上,谷歌發布了第二代TPU—CloudTPU,峰值性能達到180TFLOPS/s。第一代TPU只加速推理,但第二代TPU新增了訓練的功能。不僅如此,谷歌的用戶還能通過專門的網路,在雲端利用TPU構建機器學習的超級計算機。
Google公司TPU架構
資料來源:Google
4、寒武紀:在國際上開創了深度學習處理器方向
寒武紀科技由創始人陳天石教授帶領中科院團隊成立於2016年,致力於打造各類智能雲伺服器、智能終端以及智能機器人的核心處理器晶元。
2016年推出的寒武紀1A處理器(Cambricon-1A)是世界首款商用深度學習專用處理器,其搭載了國際首個深度學習專用處理器晶元(NPU)(屬於ASIC),面向智能手機、安防監控、可穿戴設備、無人機和智能駕駛等各類終端設備,並於2017年8月獲得了包括阿里在內的1億美元A輪融資。
寒武紀1號晶元和同期主流晶元對比
資料來源:寒武紀神經網路計算機介紹
目前寒武紀主要包括三條產品線:
(1)智能終端處理器IP授權:智能IP指令集可授權集成到手機、安防、可穿戴設備等終端晶元中,客戶包括國內頂尖SoC廠商。
(2)智能雲伺服器晶元:作為PCIE加速卡插在雲伺服器上,客戶主要是國內的知名伺服器廠商。
(3)家用智能服務機器人晶元:從智能玩具、智能助手入手,使服務機器人獨立具備看聽說的能力。客戶是各類下游機器人廠商,產品的推出將比智能雲伺服器晶元更晚一些。
中國正在發力人工智慧晶元,以縮小與全球科技巨頭的差距。


※廚電行業產業鏈及十大品牌企業分析:突破千億規模近在咫尺
※中國VR設備出貨量將超800萬台 VR產業鏈/政策/企業分析一覽
※中國共享單車產業鏈/主要品牌分析
TAG:中商情報網 |