當前位置:
首頁 > 最新 > 華為用過的寒武紀AI晶元再出新品,背後原來是科大少年班兄弟,哥哥做晶元弟弟做AI

華為用過的寒武紀AI晶元再出新品,背後原來是科大少年班兄弟,哥哥做晶元弟弟做AI

手機大戰升溫,國內不少廠家都開始把拍照作為亮點,指望靠著AI演算法,把用戶拍的更美,來俘獲芳心,增加銷量。

不過,對於智能美顏這種複雜的運算來說,目前手機通用的CPU和GPU的處理效率並不高。即使是家大業大的智能手機大戶,也會遇到人臉識別和美顏功能形同雞肋的窘境,引得用戶一陣吐槽。

於是,在不少有專業需求的國產高端智能手機上,我們看到了NPU的身影。

近日,為華為的麒麟970處理器提供NPU的智能晶元公司寒武紀科技再出新品,同時發布了第三代終端晶元Cambricon 1M和首款雲端智能晶元MLU100。

這兩款人工智慧晶元,能更好的處理計算機視覺和語音識別等方面的需求。除了智能手機的美顏功能,安防監控、可穿戴設備和無人駕駛甚至雲端伺服器等,都能從中受益。

擔憂「中國無芯」的人,或將因此吃下一粒定心丸。

NPU上一次引發廣泛關注,還是在2017年9月2日,麒麟970首次亮相的德國柏林國際消費類電子產品展覽會上。

這是華為海思用台積電10nm工藝做出來的晶元,號稱「全球首款內置獨立NPU的智能手機AI計算平台」。

NPU全稱是Neural-network Processing Unit,即神經網路處理器。與適用於通用計算的CPU和GPU比起來,它突破了兩者採用的存儲和處理分離的「馮·諾伊曼結構」,採用「數據驅動並行計算」的架構,通過調整演算法,能夠更加高效地處理AI任務。

根據官方公布的數據,麒麟970內置的NPU的能效和性能是傳統四核 CPU的50倍和25倍,這讓麒麟970圖像識別速度能夠達到約2000張/分鐘,而內置A10 Fusion的iPhone 7 Plus識別速度是487張/分鐘,搭載驍龍835的三星S8是95張/分鐘。

讓麒麟970威力巨大的這款NPU,就是寒武紀的心血。

這裡還有個小插曲。當時,在麒麟970的發布會上,華為消費者業務CEO余承東提及NPU時,用詞是「華為NPU」,而PPT里也寫著「Kirin NPU」,絲毫沒有提及寒武紀的意思。

為此,寒武紀背後的中科院洋洋洒洒寫了一封「外柔內剛」的「祝賀信」,並指出該「深度學習處理器」是「我所企業寒武紀公司(Cambricon Technologies)研製並具有自主知識產權的『寒武紀1A深度學習處理器』(Cambricon-1A Processor)」。

後來,有消息指出,寒武紀此舉是因為和華為之間只是IP授權的關係,後者並沒有買斷產權。

值得一提的是,與華為和媒體報道中對這款處理器的稱呼不同,寒武紀在信中並未提及「NPU」這一英文縮寫,而是多次強調1A是「深度學習處理器」。事實上,在最初展示1A的時候,寒武紀官方就一直在講「深度學習」。

前幾日的發布會後的採訪中,陳天石說出了背後的原因:

「我們通常不稱自己是NPU,因為Neural Processing Unit把應用限定在神經網路上。事實上,寒武紀做的是MLU(Machine Learning Unit),各種機器學習演算法,包括神經網路深度學習,也包括多種傳統機器學習演算法,都能很好地支持。」

也許是和華為的小摩擦提醒了寒武紀,在這場發布會上,「Cambricon MLU」被打上了註冊商標「」和商標「TM」的烙印,產權不容置疑。

1A是寒武紀在2016年就已經發布的「世界首款商用深度學習處理器」,除了智能手機,還可以應用於安防監控、無人機、可穿戴設備和智能駕駛等各類終端設備上。

雖然,寒武紀和華為的暗地交鋒沒有後文。好在,寒武紀也算爭氣,IP產品衍生出1A、1H之後,又在前不久發布了性能超越1A 十倍的第三代機器學習專用晶元1M。

以下是1M的部分參數:

生產工藝:台積電7nm;

8 位運算效能比:5Tops/watt(每瓦 5 萬億次運算);

處理器內核尺寸:2Tops/4Tops/8Tops;

除了與1A、1H一樣可支持 CNN、RNN、SOM 等多種深度學習模型之外,1M進一步支持SVM、k-NN、k-Means、決策樹等經典機器學習演算法的加速。

「使用 1M 的設備可以根據用戶行為對應用進行個性化定製」,寒武紀的創始人兼CEO陳天石說。

同時,他指出,1M也是「全球第一款支持本地機器學習訓練的智能處理器產品」,這意味著,日益讓全球網民困擾的用戶數據隱私問題將能被解決。

陳天石和哥哥陳雲霽都是中科大少年班精英,早早拿了博士學位,然後留在中科院計算所當研究院。哥哥研究晶元,弟弟做人工智慧。

2008年,陳雲霽和陳天石領導的課題組開始研究神經網路演算法和晶元,並且從2012年開始發表一些科研成果。當時,課題組研究出來的晶元DianNao平均性能就已經超過主流CPU核的100倍。

隨著課題日漸成熟,兩人於是在2016年到上海臨港創立了寒武紀科技。後來,由於性格原因,哥哥繼續在計算機所做研究,給晶元寫代碼,弟弟則當起了CEO,負責晶元的市場商業化推廣,華為Mate10、P20、榮耀10手機里都有用寒武紀的NPU。

寒武紀科技發布1M那天,同時被推出的還有另兩款重量級產品——Cambricon MLU 100 雲端 AI 晶元,以及內置MLU100的雲端智能處理卡。

MLU芯如其名,是一款應用範圍從神經網路擴展到了機器學習(Machine Learning)加速任務的晶元,支持各類深度學習和常用機器學習演算法,能夠處理視覺、語音、自然語言處理、經典數據挖掘等多種雲處理任務。

MLU100 採用了寒武紀最新的 MLUv01 架構以及台積電16nm工藝,並且具有兩種模式:

平衡模式——

主頻:1Ghz;

等效理論峰值速度:最高可達128 萬億次定點運算;

功耗:80W;

高性能模式——

主頻:1.3GHz;

等效理論峰值速度:166.4 萬億次定點運算;

功耗:110w。

目前,聯想和中科曙光分別推出了支持2個MLU100 智能處理計算卡的伺服器ThinkSystem SR650和支持2-10個MLU100 智能處理計算卡的PHANERON,前者打破了 37 項伺服器基準測試的世界紀錄,後者在的能效則提高了30倍。

過去接受採訪時,陳雲霽曾經說過,神經網路處理器尚處在類似「春秋戰國」的時期,和通用CPU不一樣,在這個新興領域裡,中外研究不存在太多歷史積累上的差距。

「相反深度神經網路處理器中國做得還是最早的,完全有領先的可能性。」


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 周到上海 的精彩文章:

小白鞋變白秘籍get!不同材質都難不倒我!快放下你手中的刷子!
美國抖開徵收中國產品500億關稅清單,1300個項目面臨25%關稅

TAG:周到上海 |