當前位置:
首頁 > 新聞 > 華為力推自研AI晶元,還記得大明湖畔的寒武紀嗎?

華為力推自研AI晶元,還記得大明湖畔的寒武紀嗎?

在10月10日開幕的華為2018全聯接大會上,華為輪值董事長徐直軍代表華為發布了AI發展戰略與全棧全場景AI解決方案,雷鋒網《華為ALL in Al:全面公布AI戰略及全棧全場景解決方案,AI晶元將不單獨對外銷售》一文做了詳細報道。華為這樣的重磅玩家All in AI讓本來就熱鬧的AI賽道的競爭變得更加激烈,不過在晶元層面最先受傷的可能是華為海思如今的AI合作夥伴寒武紀。

對於華為的全棧全場景AI解決方案,徐直軍這樣解釋:「我們提出的全場景,是指包括公有雲、私有雲、各種邊緣計算、物聯網行業終端以及消費類終端等部署環境。我們說的全棧是技術功能視角,是指包括晶元、晶元使能、訓練和推理框架和應用使能在內的全堆棧方案。」

兩款AI晶元——Ascend 910和Ascend 310

在華為的全棧全場景AI解決方案中,最底層可能也是此次最受關注的就是華為最新發布的兩款AI晶元——Ascend 910和Ascend 310。Ascend是華為全新的晶元產品線,中文名為昇騰,相比不久前引發熱議的阿里巴巴「平頭哥」,雖然在命名上華為沒有奪人眼球,但昇騰系列有針對不同場景的最優TOPS/W的不同產品。

徐直軍現場展示了一款已經商用的昇騰310 mini,而針對智能手機、智能附件、智能手錶的Ascend-Lite、Ascend-Tiny、Ascend-Nano將在2019年第二季度商用。

會後,徐直軍接受雷鋒網等媒體採訪時表示:「昇騰310更多是用在邊緣計算產品上,但也可以用在雲端,昇騰910更多是用在雲端,提供強大的AI訓練算力。昇騰310的Lite、Tiny、Nano主要是用於物聯網、行業終端和智能手機、智能穿戴等消費終端,以IP方式跟其他晶元結合在一起服務於各個產品。」也就是說,華為並不會單獨銷售這兩款AI晶元,而是以晶元為基礎開發AI加速模組,AI加速卡,AI伺服器,AI一體機,以及面向自動駕駛和智能駕駛的MDC(Mobile-DC)進行銷售。

當然,徐直軍也表示:「一個企業不可能擁有一個完整供應鏈,華為兩款AI晶元也不可能完全自己研發,不可能不依賴於第三方和合作夥伴。」對於一款晶元的研發,由於工藝製程已經到了7nm,設計的複雜性往往會讓設計廠商自主研發核心的IP,同時也採購第三方的IP,保證自主研發可控的前提下也能夠更快效率推出晶元。

受傷的寒武紀?

不過,華為具備AI功能的首款晶元是2017年發布的麒麟970,也被華為稱為首款人工智慧移動計算平台。余承東提及970主打的AI模塊用詞說的是"華為NPU",PPT中也寫的是"Kirin NPU"。發布會後中國科學院計算技術研究所給華為發去賀信,賀信寫到麒麟970晶元集成寒武紀1A處理器作為其核心人工智慧處理單元(即余承東總在發布會中所述NPU),實現了手機上本地、實時、高效的智能處理。

對此,華為回應稱華為和寒武紀團隊共同面向終端,在 AI 方面進行了聯合開發與優化,NPU是麒麟970異構計算的一部分,華為對麒麟970異構系統中的每個處理器都非常重視,在CPU、GPU、ISP、DSP上都投入了重要力量進行技術開發和探索,投入大量力量進行優化,力求帶來最好的效果。可見華為海思並不願多談與寒武紀的合作,與華為海思不同,寒武紀倒是在其官網上明確寫出2017年集成寒武紀1A處理器的世界首款人工智慧手機晶元華為麒麟970正式發布並在華為Mate 10手機中投入大規模商用。

今年八月底,余成東發布了麒麟系列的新一代旗艦處理器麒麟980,搭雙核NPU。有報道稱,麒麟980並未搭載此前謠傳的寒武紀最新一代1M IP,而是採用麒麟970搭載的1A優化版本1H,加上雙核,圖像識別速度提升了220%。麒麟980晶元相關負責人表示原本他們是不打算做宣傳的,而是靠口碑營銷,因為「消費者只要用了就知道有多好」。

大膽推測,麒麟900系列處理器集成寒武紀IP只是一個過渡方案,隨著昇騰系列IP以及達芬奇架構(Da Vinci)的正式發布,麒麟900系列處理器很快將集成自家的昇騰IP而非寒武紀的NPU,這或許也是華為為何一直不太願意多說麒麟970和麒麟980里的寒武紀NPU。

雷鋒網的猜想也並非完全沒有道理,在接受採訪的時候,徐直軍表示:「構建新的達芬奇架構來支持我們的人工智慧晶元是基於我們對人工智慧的理解自然產生。我們開創性的達芬奇架構支持從雲端到邊緣端,不同物聯網終端場景的人工智慧需求,從極致的低功耗需求到極致的大算力需求全覆蓋。現在我們還沒有看到市場上有其它架構能夠做到這一點。」

華為首席網路架構師黨文栓也表示:「我們設計這個晶元的時候從開始就考慮到要全場景輻射,這是我們不二選擇。」

在昇騰310晶元系列裡,Ascend-Lite就是針對智能手機的IP,因此無論從成本還是昇騰處理器發展的角度來看,寒武紀NPU被麒麟900系列處理器棄用應該只是遲早的事情。但對於寒武紀這家中國大名鼎鼎的獨角獸來說,華為是其目前已知的最重要的終端客戶,如果遭到華為的棄用,結果將如何?

合作夥伴終變競爭對手

在10月10日的華為全聯接大會上徐直軍指出:「昇騰910是計算密度最大的單晶元,採用7nm工藝製程,最大功耗為350W,半精度為(FP 16)256 Tera FLOPS,比Nvidia V100的125 Tera FLOPS還要高出近1倍。若集齊1024個昇騰910,將會出現迄今為止全球最大的AI計算集群,性能也將達到256個P,不管多複雜的模型都能輕鬆訓練。」

昇騰910或許會是寒武紀更為感到不安的產品,為什麼這麼說?今年5月,寒武紀發布首款雲端智能晶元 Cambricon MLU100 和板卡產品,實現了AI IP從終端到雲端的布局。MLU100採用MLUv01架構,基於16nm工藝,平衡模式下等效理論峰值速度達每秒128萬億次定點運算,高性能模式下等效理論峰值速度達每秒166.4萬億次定點運算,典型板級功耗為80瓦,峰值功耗不超過110瓦。

可見,無論是在製造工藝還是性能上,寒武紀的產品都沒有優勢,要知道在對算力渴望程度極高的AI領域,高算力低功耗的晶元更加受到追捧。更為嚴峻的是,寒武紀能提供的是AI板卡,華為也能提供,同時還有全棧解決方案。黨文栓在回答媒體AI投資回報的問題時就表示:「全棧解決方案更能進一步加速投資回報周期,全棧解決方案意味擁有的完整能力支撐企業級關鍵任務應用場景,而且全棧的開放性、互動性的可以更好服務企業,未來也能提供更好的選擇。」

我們知道,AI的發展讓更多的公司意識到晶元與演算法更加緊密結合的重要性,因此AI時代,晶元與其上層相關的工具、框架、應用都將會有更緊密的結合。從這個角度來看,像華為這樣的全棧解決方案提供商相比寒武紀具有明顯地優勢。雷鋒網了解到,雖然微軟並未開始大規模採購華為的AI晶元或者AI伺服器,但華為確實和微軟有接觸。當然,寒武紀和中科曙光也有著合作相當緊密,二者利用寒武紀架構打造出針對推理應用優化的伺服器。

至此不難發現,麒麟900系列處理器棄用寒武紀NPU應該是遲早的事情,並且無論是偏向終端的昇騰310還是雲端的昇騰910,華為和寒武紀都會成為競爭關係。當然,這並不意味著在AI市場只能容得下華為或寒武紀,AI是伴隨物聯網發展的一個技術,因此AI也將被應用到非常豐富的應用當中,有實力的AI企業相信最終都能找到合適的生存空間。

只不過,華為與寒武紀,恰好代表了AI市場里兩類典型的玩家,一個規模巨大具有生態優勢的大玩家,另一個因AI浪潮而生有自己的技術優勢新勢力,他們的發展都代表了一類AI企業。那麼,最終結果會如何?


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

繼「換帥」之後,通用電氣又將出售智能平台業務
麥肯錫:未來三年,銀行風控如何實現數字化轉型升級?

TAG:雷鋒網 |