誰在掘金 AI 晶元？這裡有一份長長的 List

科技 02-01

據相關媒體報道，中國晶元 90% 依賴進口，過去十年累計耗資高達 1.8 萬億美元。即便按照較低的匯率折算，也已經遠超 10 萬億元人民幣。然而，這幾年中國的創業者和投資者都逐漸開始關注 AI 晶元，有觀點認為在這個新的晶元領域，中國可以說和世界已經在同一個起跑線上了。

那麼，中國 AI 晶元中的玩家到底都有誰呢？我們今天就來盤點一下。

中星微

早在 2016 年，中星微便宣布他們的中國首款「星光智能一號」嵌入式 NPU 已經在當年 3 月 6 日實現了量產。

據介紹，「星光智能一號」VC0758 採用了「數據驅動」並行計算的架構，可以支持 Caffe、TensorFlow 等多種神經網路框架，支持 AlexNet、GoogleNet 等各類神經網路。單顆 NPU(28nm) 能耗僅為 400 mW，極大地提升了計算能力與功耗的比例，可以廣泛應用於智能駕駛輔助、無人機、機器人等嵌入式機器視覺領域。

不過，業內也有觀點稱這不是一個專為加速 Neural Network 而開發的處理器，該觀點認為其內部集成了多個 DSP 核（其稱為 NPU core），通過 SIMD 指令的調度來實現對 CNN、DNN 的支持，以這個邏輯，似乎很多晶元都可以叫 NPU。

地平線機器人

Horizon Robotics（地平線機器人）由前百度深度學習研究院負責人余凱創辦，致力於打造基於深度神經網路的人工智慧「大腦」平台-包括軟體和晶元，可以做到低功耗、本地化的解決環境感知、人機交互、決策控制等問題。

2017 年底，該公司已經發布了 面向智能駕駛的征程 (Journey)1.0 處理器和面向智能攝像頭的旭日 (Sunrise)1.0 處理器。這是完全由地平線自主研發的人工智慧晶元，採用地平線的第一代 BPU 架構——高斯框架，具有全球領先的性能：可實時處理 1080p@30 視頻，每幀中可同時對 200 個目標進行檢測、跟蹤、識別，典型功耗 1.5W，每幀延時小於 30ms。

寒武紀

2016 年，寒武紀科技於北京中關村和上海臨港註冊成立，這一年裡，寒武紀科技面向產業界發布了商用深度學習處理器 IP 產品寒武紀 1A。為了讓晶元處理速度變得更快，寒武紀還專門為 1A 設計了專門的存儲結構，並設計了完全不同於通用 CPU 的指令集，在 1GHz 主頻下理論峰值性能為每秒 5120 億次半精度浮點運算，對稀疏化神經網路的等效理論峰值高達每秒 2 萬億次浮點運算。在若干關鍵人工智慧應用上實測，寒武紀 1A 達到了傳統的四核通用 CPU 25 倍以上的性能和 50 倍以上的能效。

2017 年，集成了寒武紀技術的華為 Kirin970 手機晶元和 Mate 10 手機全球發布，實測結果表明寒武紀科技與華為的聯合研發成果在圖片識別速度上超越了搭載 A11 晶元的 iPhone X。

而去年底，寒武紀又公布了 3 款新一代 AI 處理器：面向低功耗場景視覺應用的寒武紀 1H8（能效比為 1A 的 2.3 倍）；擁有更廣泛通用性和更高性能的寒武紀 1H16 以及面向智能駕駛領域的寒武紀 1M。

另外，寒武紀還發布了面向雲端的高性能智能處理器產品線：寒武紀高性能機器學習處理器晶元「寒武紀 MLU100」和「寒武紀 MLU200」，這兩款晶元分別偏重推理和訓練兩個用途。

此外，寒武紀還表示其未來的晶元產品將全面支持多樣化的機器學習應用，而不僅僅是常見的深度學習。

深鑒科技

深鑒科技成立於 2016 年，致力於成為國際先進的深度學習加速方案提供者。該公司號稱具備世界頂尖的神經網路壓縮、編譯、體系結構與指令集結構設計、FPGA 開發和系統集成的完整開發能力。

目前，深鑒科技已經自主研發了亞里士多德架構的 DPU (Deep Learning Processor Unit) 。據了解，DPU 是面向深度學習 (DL) 應用的可編程通用計算平台，可以處理諸如圖像和視頻的分類、分割、檢測、跟蹤等任務。DPU 定義和實現了一套用於映射深度神經網路 (DNN) 演算法的高度優化可編程指令集，在實現高性能、高能效比目標的同時兼顧通用型和靈活性，不僅支持現有絕大部分流行的卷積神經網路 (AlexNet、VGG,、GoogLeNet、ResNet，Faster-RCNN, SSD, YOLO 等)，同時具備高度可擴展性，在 DPU 指令集提供支持的基礎上可以無縫運行其它用戶自行擴展或衍生的神經網路。

目前，深鑒科技也已經推出了多款人工智慧加速模塊，2018 年還將推出首款 SoC 系列晶元——聽濤 Tingtao。

西井科技

西井科技成立於 2015 年 5 月，是一家開發「類腦神經元晶元+演算法」的科技公司，致力構造一種完全跳脫於馮諾依曼結構的神經形態的晶元結構——即模擬人腦神經元工作原理而製造出的晶元，它既具備人腦的學習能力，又具備強大的特定運算能力，僅需一塊郵票大小的晶元，就能模仿人類大腦在短時間內處理海量的感官信息。據稱該晶元具有低功耗，高效率，無需聯網等優勢。

目前，西井科技已經推出了兩款晶元：

可模擬 5000 萬級別「神經元」的仿生類腦神經元晶元——deepsouth（深南），功耗為傳統晶元在同一任務下的幾十分之一到幾百分之一。
擁有 12800 萬個神經元，通過專屬指令集調整晶元中神經元資源分配的深度學習類腦神經元晶元——deepwell（深井）。

雲天勵飛

雲天勵飛創始人陳寧曾是中興通訊 IC 技術總監，帶領過 400 多人的晶元研發團隊。此外，他還是國家」千人計劃」特聘專家，國僑辦」重點華僑創業團隊」帶頭人。2014 年 8 月，陳寧創立雲天勵飛，主打智能視頻與圖像識別。

該公司一大特色便是其設計開發了一款名叫 IPU (intelligent Processing Unit) 的晶元，專門面向深度學習的多層神經網路的計算並將它的運算效率提升到 100 倍以上，通過重新定義一套指令值，使它運行和計算深度神經網路可以更加高效。

有消息顯示，該晶元將於今年出貨。

Think Force

Think Force 成立於 2017 年，據介紹其團隊核心成員主要來自 IBM，AMD，INTEL, ZTE 等業界龍頭晶元企業，且都具備十年以上的專業晶元研發設計經歷。該公司主要設計融合一流 AI 演算法和先進位成工藝的智能晶元，並以此構建人工智慧硬體平台，提供一站式行業應用解決方案。

據稱，該晶元採用自主研發的微內核 ManyCore 架構，能完成 AI 雲虛擬化調度在晶元級的實現，晶元虛擬化技術在需要彈性計算的場景中能夠成倍提高晶元使用率。另外，結合自主研發的固件和相關 SDK 能夠實現對於各類神經網路模型的計算加速，加速單元實際效率在 90% – 95% 之間，相對於 Nvidia 的主流計算卡能達到 5 倍以上的功耗和成本節省。

比特大陸

近年來比特幣大火，而這也帶來了挖礦行業的繁榮，而比特大陸便是在這次挖礦行業爆發中迅速崛起的企業，該公司憑藉自己設計的比特幣挖礦專用 ASIC 晶元，一舉躍入 2017 年中國 IC 設計公司前五的行列。據稱，目前全球 80% 甚至 90% 的礦機都由該公司提供。

而去年 11 月底比特大陸則發布了一款名叫 BM1680 的 TPU 張量加速計算晶元，正式進軍 AI 晶元領域。據了解，該晶元可適用於 CNN、RNN 和 DNN 等多種神經網路的預測和訓練，其加速核採用了改進型 Systolic 架構技術，與 Google TPU 體系架構類似。

數據處理方面，該晶元浮點運算能力峰值可達 2TFlops，而峰值功耗則為 41 瓦，平均功耗為 25 瓦。

啟英泰倫

成都啟英泰倫科技有限公司是一家專註於人工智慧晶元設計及配套智能演算法引擎開發的公司，它於 2016 年 9 月推出了專用的基於 ASIC 架構深度神經網路智能語音識別晶元 CI1006，並已實現了量產和出貨。

CI1006 是基於 ASIC 架構的人工智慧語音識別晶元，包含了腦神經網路處理硬體單元，能夠完美支持 DNN 運算架構，進行高性能的數據並行計算，可極大的提高人工智慧深度學習語音技術對大量數據的處理效率。

據介紹，這是一款專用於智能語音識別晶元方案，包含了腦神經網路處理硬體單元，能夠完美支持 DNN 運算架構，性能相當於數十個 CPU 核的並行計算能力，成本不到通用晶元方案成本的 1/2，功耗則在 1/10 以下。目前，基於該晶元的單/雙麥克風方案均可以實現十米識別距離，識別精度在 90% 以上。

耐能科技

耐能 (Kneron)於 2015 年由台灣人創立於美國聖地牙哥，創始人劉峻誠表示，公司的核心競爭力在於主打輕量級的 NPU，能耗比可以做到 100mW 到 300mW，最新的一款產品甚至可以到 10mW 以下。

而且其晶元尺寸也比較小，比如耐能（Kneron）於 2016 年推出終端裝置專用的人工智慧晶元——神經網路處理器（Neural Processing Unit，NPU），相較於主流的神經網路晶元，體積可以縮小至 1/40。

深思考科技

深思考是一家專註於類腦人工智慧與深度學習核心科技的高科技公司。核心團隊由來自於中科院自動化所、軟體所、計算所、微電子所等中科院院所人工智慧、機器學習方向的資深科學家組成。

公司目前已經推出了 ARGUS DPU 深度學習處理器，可為專用領域（如智能視頻處理、安防監控、ADAS、醫療圖像處理等）的人工智慧與深度學習計算提供高性能硬體加速，賦予智能終端高性能、高可靠、實時的深度學習計算能力。除各類深度學習演算法外，也支持各類傳統演算法框架（如 OpenCV），並提供豐富的介面滿足客戶產品的應用需求。ARGUS DPU 支持處理模組級聯，以成倍提高實時算力。不過，目前該公司並沒有透露具體的性能參數。

異構智能

異構智能是由著名人工智慧專家、計算機博弈專家、異構智能專家吳韌博士挂帥，帶領一批人工智慧、深度學習和異構計算領域頂尖的技術人才組成團隊，於 2015 年 8 月在矽谷創立的公司，專註於提供「ASIC 晶元＋訓練模型」的全棧式 AI 解決方案。

今年 CES 期間，該公司發布了其第一款高性能、低功耗的 AI 晶元 NovuTensor。

異構智能方面表示這是截至目前世界上唯一一款能夠實際運行的、性能達到主流 GPU/TPU 水平而性能/功耗比卻遠超主流 GPU/TPU 的晶元——在功耗 12w 的情況下，NovuTensor 每秒可識別 300 張圖像，每張圖像上，最多可檢測 8192 個目標，相比目前最先進的桌面伺服器 GPU（250W，每秒可識別 666 張圖像），僅使用 1/20 電力即可達到其性能的 1/2；而相比目前最先進的移動端或嵌入式晶元，相同用電的情況下，性能是其三倍以上。

寫在最後

需要提及的是，號稱「世界首款手機 AI 晶元」的華為麒麟 970 並未收錄到本文中，因為麒麟 970 使用的是寒武紀的神經網路處理單元（NPU），在物體識別方面的一整套嵌入式 AI 解決方案則來自中科創達。

無論如何，AI 晶元領域發展得相當快，未來也勢必將有更多的 AI 晶元企業入局。中國的這些企業能否破除中國晶元高度依賴進口的魔咒呢？我們拭目以待。

相關閱讀：《AI 晶元，是金山還是泡沫？》

題圖來自 123RF

本文誰在掘金 AI 晶元？這裡有一份長長的 List來自動點科技.

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 動點科技 的精彩文章:

※沃爾瑪涉足電子書閱讀器市場，挑戰亞馬遜 Kindle
※傳 LINE 計劃整合加密貨幣支付功能，增強用戶黏性

TAG:動點科技 |