當前位置:
首頁 > 新聞 > 三星將推首款AI晶元NPU,性能超華為蘋果,智能終端AI芯大PK

三星將推首款AI晶元NPU,性能超華為蘋果,智能終端AI芯大PK

新智元報道

新智元編輯部

【新智元導讀】作為AI晶元後入者的三星正提著大刀趕來:據外媒爆料,三星已經接近完成一款AI晶元的研發,其性能已經堪比蘋果的A11和華為麒麟970,三星極有可能在2月25日舉行的MWC 2018大會上發布Galaxy S9的同時,展示其新AI技術的能力。

據《韓國先驅報》網站報道,三星電子已經基本完成第一款神經處理單元(NPU)的開發工作,準備在今年晚些時候部署到設備上。NPU被廣泛稱為AI晶元,據稱三星將在即將發布的智能手機上搭載這款晶元,此舉有助於其手機趕超競爭對手。

「據三星內部人士爆料,三星已經基本完成了伺服器AI晶元的開發工作,預計該晶元將出售給伺服器廠商。」一名AI專家告訴《韓國先驅報》。

除了CPU、GPU等之外,智能手機上再加上NPU的話,手機本身就可以在沒有雲伺服器幫助的情況下處理、分析和存儲智能手機上產生的數據。NPU被廣泛認為是智能手機的大腦。

目前,三星在這個領域落後於蘋果和華為這兩個最大的競爭對手,後兩者都已經推出了移動端的AI晶元。蘋果公司去年發布了iPhone X,使用NPU實現臉部識別和動畫表情符號等人們熟知的功能。緊接著,華為推出了一款能夠隨時間學慣用戶習慣的NPU,部署在Mate 10 Pro手機上。

儘管三星對於這個市場是後來者,但那位「AI專家」對韓國先驅報稱,「三星已經達到蘋果和華為的技術水平,而且在今年下半年肯定會推出更好的晶元。」據報道,三星的晶元每秒運行的速度超過了蘋果的A11和華為的麒麟970。

此外,同一消息人士透露,三星可能將在2月25日舉行的MWC 2018大會上發布Galaxy S9的同時,展示其新AI技術的能力。

據稱三星在人工智慧相關項目上投入了大量資金,並與韓國各大學的教授和研究人員合作,以製造出相比競爭對手更安全、更高效的晶元。

該消息人士透露,三星還正在為Galaxy Note 9智能手機開發一款增強的NPU,該款手機預計在今年9月份發布。就像之前的Galaxy Note 7和Note 8一樣,Note 9可能成為三星的一個轉折點。

AI手機進入戰國時代,晶元研發馬太效應漸顯

正如上文所說,三星的這款AI晶元,主要的競爭對手是蘋果和華為。目前,蘋果的iPhoneX和華為的Mate10(Pro)、V10等系列手機均已經使用人工智慧晶元,成為AI手機的領導者。

iPhone X中的「A11生物神經網路引擎」(A11 bionic neural engine)晶元,每秒運算次數最高可達6000億次,相當於0.6TFlops(寒武紀NPU則是1.92TFlops,每秒可以進行19200次浮點運算),採用了六核心設計,由2個高性能核心與4個高能效核心組成。相比A10,其中兩個性能核心的速度提升了25%,四個能效核心的速度提升了70%。工藝方面,A11採用了台積電10nm FinFET工藝,集成了43億個晶體管。

A11能幫助加速人工智慧任務,包括Face ID,Animoji和AR應用程序。A11同時支持Core ML,這是蘋果在WWDC開發者大會上推出的一款新型機器學習框架。Core ML支持所有主要的神經網路,如DNN、RNN、CNN等,開發者可以把訓練完成的機器學習模型封裝進App之中。

華為麒麟970晶元,首次採用台積電10nm工藝,集成55億個晶體管(驍龍835是31億顆,蘋果A10是33億顆),功耗降低20%。採用4個Cortex A73 核心,4個Cortex A53 核心,GPU為具有12個核心的 Mali-G72 MP12,每秒處理速度可達萬億次。麒麟970晶元內置全新升級自研相機雙ISP,支持人工智慧場景識別、人臉追焦、智能運動場景檢測,同時夜拍效果再次升級。基帶方面,麒麟970採用了更先進的4.5G LTE技術,支持全球最高是LTE Cat.18規格,實現目前業界最高的1.2Gbps峰值下載速率。同時內建TEE和inSE安全引擎,擁有更高的安全性。

不過,三星、蘋果、華為「三國殺」的局面不會持續很久。

由於智能手機的競爭進入到嚴重的同質化階段,跟全面屏一樣,人工智慧晶元將會是手機廠商下一個「標配」的重點。除了三星、蘋果、華為三巨頭,還有很多廠商湧入智能手機和AI晶元的競爭,例如最近傳聞將於2018年下半年上市的小米——2017年2月,小米自主研發的手機晶元澎湃S1問世,成為國產手機中第二家擁有自主研發晶元能力的手機廠商。

人工智慧晶元對手機性能提升、人機交互等功能上有巨大的想像空間,AI手機特別是高端旗艦AI手機的研發能力是能夠拉開與對手差距的重要一步,手機市場格局也會隨著研發能力逐漸分化,強者更強,弱者更弱的馬太效應將逐漸凸顯。

移動端AI晶元,誰能笑到最後?

由於GPU存在功耗瓶頸,同時用戶越來越關心個人隱私安全與時效性,終端智能晶元的發展順應時代所需。

終端的智能晶元則需要同時具備高性能與低功耗的特徵。此外,終端也涵蓋了不同的應用場景,都需要針對具體需求,在功耗、延遲、數據吞吐量、加速器方案的選擇上做出調整和優化。

新智元對部分移動端能夠支撐AI功能的晶元做了梳理:

谷歌:Pixel VisualCore

2017年10月,Google在其官方博客上公開了Pixel2中使用的一顆專用圖像處理協處理器——Pixel VisualCore。這是Google在用於伺服器的TPU之後推出的第二顆晶元,這次針對的是移動端。Pixel VisualCore由Google與Intel合作設計開發,主要用於圖像處理和機器學習。這塊晶元由8個IPU(每個包含512個ALU)+1個Cortex-A53核心組成,最大可提供3TFLOPS浮點運算能力。

高通:驍龍845處理器

說到手機晶元,怎能不提高通。高通在2017年12月初正式發布了驍龍845移動平台。驍龍845處理器採用10納米LPP製程工藝,其中GPU採用Adreno 630,X20 LTE數據機、WiFi、影像方面使用Spectra 280ISP,以及Hexagon 685DSP協處理器、音質方面使用高通Aqstic Audio、CPU採用四個2.8GHz大核+四個1.8GHz小核+2MB緩存的Kryo 385 CPU、移動安全晶元,另在845中新增了一塊獨立內存。AI方面,驍龍845主要通過Kryo 385定製架構、Adreno 630、Hexagon 685在終端非同步運算數據。相比835,驍龍845在AI上的計算能力是835的三倍,目前已經可以支持S845GoogleTensorFlow、Facebook Caffe以及Open NeuralNetwork Exchange在內的多款主流深度學習框架。

Movidius VPU Myriad2

2016年9月,Intel發表聲明收購了Movidius。Movidius專註於研發高性能視覺處理晶元。現任CEO是原來德州儀器OMAP部門的總經理,它的技術指導委員會也是實力強大,擁有半導體和處理器行業的元老級人物——被蘋果收購的 P.A.Semi 創始人丹尼爾·多伯普爾(Daniel Dobberpuhl),卡內基梅隆大學計算機科學/計算機視覺專家金出武雄,以及前蘋果 iPhone 和 iPod 部門工程副總裁、資深工程師大衛·圖普曼(David Tupman)三人坐鎮。

其最新一代的Myriad2視覺處理器主要由SPARC處理器作為主控制器,加上專門的DSP處理器和硬體加速電路來處理專門的視覺和圖像信號。這是一款以DSP架構為基礎的視覺處理器,在視覺相關的應用領域有極高的能耗比,可以將視覺計算普及到幾乎所有的嵌入式系統中。該晶元已被大量應用在Google 3D項目Tango手機、大疆無人機、FLIR智能紅外攝像機、海康深眸系列攝像機、華睿智能工業相機等產品中。

寒武紀 1H8和1H16

寒武紀於2016年發布了全球首款商用深度學習專用處理器IP——寒武紀1A處理器。寒武紀1A的橫空出世打破了多項記錄,受到了業界廣泛關注,入選了第三屆世界互聯網大會評選的十五項「世界互聯網領先科技成果」。2017年11月,在公司首次發布會上,CEO陳天石介紹了三款全新的智能處理器IP產品,其中就包括面向低功耗場景視覺應用的寒武紀1H8、擁有更廣泛通用性和更高性能的寒武紀1H16。

陳天石介紹說,與寒武紀1A相比,新品在功耗、能效比、成本開銷等方面進行了優化,性能功耗比再次實現飛躍,適用範圍覆蓋了圖像識別、安防監控、智能駕駛、無人機、語音識別、自然語言處理等各個重點應用領域。

地平線旭日和征程

2017年12月20日,地平線在北京舉行發布會,推出的征程(Journey)和旭日(Sunrise)兩款面向計算機視覺的處理器,分別用於無人駕駛和智能攝像頭。旭日和征程都屬於嵌入式人工智慧視覺晶元,分別面向智能駕駛和智能攝像頭。地平線首席晶元架構師周峰對新智元介紹,這兩款晶元,晶元性能可達到1Tops,實時處理1080P@30幀,每幀可同時對200個目標進行檢測、跟蹤、識別。 典型功耗做到1.5w。

深鑒聽濤

2017年10月24日,深鑒科技召開發布會,正式對外宣布完成約4000萬美元A+輪融資,由螞蟻金服與三星風投領投。CEO姚頌還公布了一系列晶元計劃,由深鑒自主研發的晶元「聽濤」、「觀海」將於2018年第三季度面市。

其中,「聽濤」將於2018年上半年完成產品裝載,該系列晶元採用台積電28納米製程,核心使用深鑒自己的亞里士多德架構,峰值性能1.1瓦 4.1 TOPS。亞里士多德架構針對卷積神經網路而設計。目前,卷積神經網路一般用來處理圖像相關的智能問題,而此架構靈活與可擴展的特性使它可被應用於各種不同規格的終端中。

異構智能:NovuTensor

在今年 CES 上,NovuMind(中文名稱「異構智能」)向業界首次展示其自主研發的第一款高性能、低功耗的 AI 晶元 NovuTensor,號稱可能是除了 TPU 之外,世界上跑得最快的單晶元。

NovuMind 方面表示,這是截至目前世界上唯一能夠實際運行的、性能達到主流 GPU/TPU 水平而性能/功耗比卻遠超主流 GPU/TPU 的晶元——在功耗 12w 的情況下,NovuTensor 每秒可識別 300 張圖像,每張圖像上,最多可檢測 8192 個目標,相比目前最先進的桌面伺服器 GPU(250W,每秒可識別 666 張圖像),僅使用 1/20 電力即可達到其性能的 1/2;而相比目前最先進的移動端或嵌入式晶元,相同用電的情況下,性能是其三倍以上。據了解,本次 CES 展示的僅僅是 FPGA 版本,等正在流片的 ASIC 晶元正式出廠,性能將提高 4 倍,耗電將減少一半,耗能不超過 5 瓦、可進行 15 萬億次運算的超高性能。

GTI 光矛處理器

成立於2017年初的Gyrfalcon Technology Inc.(簡稱GTI)近期以「光矛處理器 Lightspeeur 2801S」引發業內關注,這也是一家由中國晶元老兵創立的公司,總部位於美國矽谷。其晶元方案基於APiM架構,有28000個並行神經計算核,真正支持片上並行與原位計算,不需要使用外部存儲單元,克服了由存儲器帶寬而導致的性能瓶頸,在效率能耗比方面表現卓越,達到9.3Tops/Watt,無論在訓練模式還是推理模式下均可提供高密度計算性能。

在今年的CES上,GTI推出了內置Lightspeeur 2801S晶元的Laceli 人工智慧計算棒,可以在1瓦的功率下提供超過每秒9.3萬億次浮點運算的性能,超越英特爾Movidius的神經計算棒,後者每瓦功率範圍的運算力則是0.1萬億次。Laceli 人工智慧計算棒可以在多種深度學習場景中應用,包括圖像和視頻識別、理解及描述, 自然語言理解、自然語言處理等。

加入社群

新智元AI技術+產業社群招募中,歡迎對AI技術+產業落地感興趣的同學,加小助手微信號: aiera2015_1 入群;通過審核後我們將邀請進群,加入社群後務必修改群備註(姓名-公司-職位;專業群審核較嚴,敬請諒解)。

此外,新智元AI技術+產業領域社群(智能汽車、機器學習、深度學習、神經網路等)正在面向正在從事相關領域的工程師及研究人員進行招募。

加入新智元技術社群 共享AI+開放平台


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

谷歌中國AI中心2018實習生職位正式開放申請

TAG:新智元 |