華為用過的寒武紀AI晶元再出新品，背後原來是科大少年班兄弟，哥哥做晶元弟弟做AI

最新 05-08

手機大戰升溫，國內不少廠家都開始把拍照作為亮點，指望靠著AI演算法，把用戶拍的更美，來俘獲芳心，增加銷量。

不過，對於智能美顏這種複雜的運算來說，目前手機通用的CPU和GPU的處理效率並不高。即使是家大業大的智能手機大戶，也會遇到人臉識別和美顏功能形同雞肋的窘境，引得用戶一陣吐槽。

於是，在不少有專業需求的國產高端智能手機上，我們看到了NPU的身影。

近日，為華為的麒麟970處理器提供NPU的智能晶元公司寒武紀科技再出新品，同時發布了第三代終端晶元Cambricon 1M和首款雲端智能晶元MLU100。

這兩款人工智慧晶元，能更好的處理計算機視覺和語音識別等方面的需求。除了智能手機的美顏功能，安防監控、可穿戴設備和無人駕駛甚至雲端伺服器等，都能從中受益。

擔憂「中國無芯」的人，或將因此吃下一粒定心丸。

NPU上一次引發廣泛關注，還是在2017年9月2日，麒麟970首次亮相的德國柏林國際消費類電子產品展覽會上。

這是華為海思用台積電10nm工藝做出來的晶元，號稱「全球首款內置獨立NPU的智能手機AI計算平台」。

NPU全稱是Neural-network Processing Unit，即神經網路處理器。與適用於通用計算的CPU和GPU比起來，它突破了兩者採用的存儲和處理分離的「馮·諾伊曼結構」，採用「數據驅動並行計算」的架構，通過調整演算法，能夠更加高效地處理AI任務。

根據官方公布的數據，麒麟970內置的NPU的能效和性能是傳統四核 CPU的50倍和25倍，這讓麒麟970圖像識別速度能夠達到約2000張/分鐘，而內置A10 Fusion的iPhone 7 Plus識別速度是487張/分鐘，搭載驍龍835的三星S8是95張/分鐘。

讓麒麟970威力巨大的這款NPU，就是寒武紀的心血。

這裡還有個小插曲。當時，在麒麟970的發布會上，華為消費者業務CEO余承東提及NPU時，用詞是「華為NPU」，而PPT里也寫著「Kirin NPU」，絲毫沒有提及寒武紀的意思。

為此，寒武紀背後的中科院洋洋洒洒寫了一封「外柔內剛」的「祝賀信」，並指出該「深度學習處理器」是「我所企業寒武紀公司（Cambricon Technologies）研製並具有自主知識產權的『寒武紀1A深度學習處理器』（Cambricon-1A Processor）」。

後來，有消息指出，寒武紀此舉是因為和華為之間只是IP授權的關係，後者並沒有買斷產權。

值得一提的是，與華為和媒體報道中對這款處理器的稱呼不同，寒武紀在信中並未提及「NPU」這一英文縮寫，而是多次強調1A是「深度學習處理器」。事實上，在最初展示1A的時候，寒武紀官方就一直在講「深度學習」。

前幾日的發布會後的採訪中，陳天石說出了背後的原因：

「我們通常不稱自己是NPU，因為Neural Processing Unit把應用限定在神經網路上。事實上，寒武紀做的是MLU（Machine Learning Unit)，各種機器學習演算法，包括神經網路深度學習，也包括多種傳統機器學習演算法，都能很好地支持。」

也許是和華為的小摩擦提醒了寒武紀，在這場發布會上，「Cambricon MLU」被打上了註冊商標「」和商標「TM」的烙印，產權不容置疑。

1A是寒武紀在2016年就已經發布的「世界首款商用深度學習處理器」，除了智能手機，還可以應用於安防監控、無人機、可穿戴設備和智能駕駛等各類終端設備上。

雖然，寒武紀和華為的暗地交鋒沒有後文。好在，寒武紀也算爭氣，IP產品衍生出1A、1H之後，又在前不久發布了性能超越1A 十倍的第三代機器學習專用晶元1M。

以下是1M的部分參數：

生產工藝：台積電7nm；

8 位運算效能比：5Tops/watt（每瓦 5 萬億次運算）；

處理器內核尺寸：2Tops/4Tops/8Tops；

除了與1A、1H一樣可支持 CNN、RNN、SOM 等多種深度學習模型之外，1M進一步支持SVM、k-NN、k-Means、決策樹等經典機器學習演算法的加速。

「使用 1M 的設備可以根據用戶行為對應用進行個性化定製」，寒武紀的創始人兼CEO陳天石說。

同時，他指出，1M也是「全球第一款支持本地機器學習訓練的智能處理器產品」，這意味著，日益讓全球網民困擾的用戶數據隱私問題將能被解決。

陳天石和哥哥陳雲霽都是中科大少年班精英，早早拿了博士學位，然後留在中科院計算所當研究院。哥哥研究晶元，弟弟做人工智慧。

2008年，陳雲霽和陳天石領導的課題組開始研究神經網路演算法和晶元，並且從2012年開始發表一些科研成果。當時，課題組研究出來的晶元DianNao平均性能就已經超過主流CPU核的100倍。

隨著課題日漸成熟，兩人於是在2016年到上海臨港創立了寒武紀科技。後來，由於性格原因，哥哥繼續在計算機所做研究，給晶元寫代碼，弟弟則當起了CEO，負責晶元的市場商業化推廣，華為Mate10、P20、榮耀10手機里都有用寒武紀的NPU。

寒武紀科技發布1M那天，同時被推出的還有另兩款重量級產品——Cambricon MLU 100 雲端 AI 晶元，以及內置MLU100的雲端智能處理卡。

MLU芯如其名，是一款應用範圍從神經網路擴展到了機器學習（Machine Learning）加速任務的晶元，支持各類深度學習和常用機器學習演算法，能夠處理視覺、語音、自然語言處理、經典數據挖掘等多種雲處理任務。

MLU100 採用了寒武紀最新的 MLUv01 架構以及台積電16nm工藝，並且具有兩種模式：

平衡模式——

主頻：1Ghz;

等效理論峰值速度：最高可達128 萬億次定點運算；

功耗：80W；

高性能模式——

主頻：1.3GHz；

等效理論峰值速度：166.4 萬億次定點運算；

功耗：110w。

目前，聯想和中科曙光分別推出了支持2個MLU100 智能處理計算卡的伺服器ThinkSystem SR650和支持2-10個MLU100 智能處理計算卡的PHANERON，前者打破了 37 項伺服器基準測試的世界紀錄，後者在的能效則提高了30倍。

過去接受採訪時，陳雲霽曾經說過，神經網路處理器尚處在類似「春秋戰國」的時期，和通用CPU不一樣，在這個新興領域裡，中外研究不存在太多歷史積累上的差距。

「相反深度神經網路處理器中國做得還是最早的，完全有領先的可能性。」

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 周到上海 的精彩文章:

※小白鞋變白秘籍get！不同材質都難不倒我！快放下你手中的刷子！
※美國抖開徵收中國產品500億關稅清單，1300個項目面臨25％關稅

TAG:周到上海 |