當前位置:
首頁 > 最新 > 評蘋果A11神經網路引擎:AI加速將成為高端手機晶元標配

評蘋果A11神經網路引擎:AI加速將成為高端手機晶元標配

蘋果在最新發布會上,公布了十周年版iPhone X,極大地吸引了人們的注意力。在iPhone X眾多特性中,使用面部識別FaceID代替原有的指紋識別TouchID進行屏幕解鎖和身份認證無疑是最大的亮點之一,這有可能成為蘋果對於手機交互進步的又一次推動。

FaceID使用了人工智慧技術完成人臉三維建模中的特徵提取,並且用這些特徵配合演算法來實現人臉識別。現場演示中,FaceID人臉識別用戶體驗非常流暢,而在流暢體驗背後的功臣,則是A11 Bionic SoC上集成的人工智慧加速器,蘋果官方稱之為「神經網路引擎(neural engine)」。

什麼是人工智慧加速器

我們首先來看一下什麼是人工智慧加速器。要理解人工智慧加速器的概念,不妨先回顧一下GPU。在上世紀90年代,隨著多媒體應用,尤其是3D遊戲的興起,人們發現傳統的CPU的架構對於這類需要高速圖形渲染的應用力不從心,原因是CPU在晶元上放了許多控制邏輯和緩存單元,真正留給計算單元的晶元面積反而不多。

這時候,人們設計了3D加速卡,以3dfx,Nvidia和ATI為代表的晶元公司在當年可以說是叱吒風雲,而隨著時間和市場的變遷,3D加速卡的概念也慢慢過渡到了用來處理通用圖形計算甚至通用並行運算的GPU,而在今天市面上的獨立顯卡廠商也只剩下了Nvidia和ATI。

人工智慧加速器和GPU很像,只是當年的驅動應用是多媒體和3D遊戲,而今天的驅動應用則是人工智慧,包括語音助手,人臉識別,物體識別等等。這一波興起的人工智慧的基礎演算法是神經網路,而神經網路會大量用到矩陣乘法以及卷積運算。又一次,人們發現CPU的運算能力無法支撐目前的人工智慧運算了,而GPU雖然也能實現高速人工智慧運算,但是功耗太大(為了移動應用設計的Nvidia TX2都要消耗10W之多的功耗),於是,為了讓更多的移動設備能用上人工智慧,人工智慧加速器就應運而生了。

人工智慧加速器通常是一塊專用的硬體單元,可以以單獨晶元或者SoC上的IP的形式存在。由於專門為人工智慧加速設計,因此在處理此類運算時可以實現非常高的性能並且消耗很低的功耗。之前在華為公布的Kirin 970上,就集成了這樣一塊人工智慧加速器,可見人工智慧加速器正在越來越多地進入移動晶元市場。

華為麒麟970上也集成了人工智慧加速模塊

蘋果在人工智慧硬體加速方面的布局

蘋果在人工智慧這一重大風口自然不甘落後,在人工智慧加速領域也早就有了布局。

看如今市場,Nvidia之所以能佔據人工智慧硬體的領頭羊位置,與其開放易用的CUDA介面方便程序員使用GPU加速人工智慧不無關係。而在移動端,如何充分調用SoC上的GPU來加速人工智慧一直讓開發者頗為頭痛。蘋果在之前就公布了Metal和Core ML兩個不同層面的介面可供開發者調用,以加速iOS平台上的人工智慧應用。

公布軟體介面的另一目的,就是為了為專用硬體的開發積累經驗,以實現軟硬體協同優化。在今年五月,就有消息稱蘋果名為「神經網路引擎」的專用人工智慧加速硬體已經基本完成。而到了今天,蘋果則真正公開宣布了神經網路引擎。

A11神經網路引擎分析

蘋果在發布會上公布的關於神經網路引擎的信息包括:

使用雙核心設計。由於缺乏其他配套信息,從這條信息中我們能推測出的就是蘋果或許可以允許神經網路引擎的幾種使用模式,包括全關閉,只打開一個核,以及雙核全部打開,以滿足不同情況下的性能/功耗需求。

性能可達0.6TOPS。這樣的性能已經能處理目前主流的神經網路模型計算。可見,目前1TOPS左右的處理性能將會成為人工智慧加速器的標配。

實時處理。GPU處理人工智慧運算時,另一個令人詬病的問題就是延遲大,因為GPU往往是基於塊數據(batch)處理,因此在需要實時作出反應的移動端並不適合。蘋果的神經網路引擎則強調了自己是實時處理這一點,顯然是為了與GPU作出區分,以配合移動端實時應用的需求。

除此之外,我們還能猜到神經計算引擎是SoC上的一個IP模塊,而不是單獨的一塊晶元。

我們可以和其他包含類似加速模塊的晶元對比。華為的麒麟970包含了和蘋果神經網路引擎類似的人工智慧加速模塊,其峰值性能可達1.93TOPS(為蘋果神經網路引擎的3倍多),但是實際性能不等於峰值性能,還需要取決於軟硬體協同優化效果。高通的梟龍系列包含Neural Processing Engine軟體SDK,能幫助開發者更好地利用高通晶元上的GPU/CPU/DSP完成人工智慧加速。可以說,高通的方案相比華為和蘋果顯得較為保守(之前推出過Zeroth人工智慧硬體加速模塊但是後來被放棄了),但是在人工智慧的大潮下估計高通也會在之後的晶元中加入相關人工智慧加速器。

雖然發布會公布了不少信息,但是還有更多未知,需要時間去澄清。

最令人感興趣的問題,恐怕是神經網路引擎除了FaceID之外,還可以用在哪些其他的地方?由於FaceID對於實時性的需求不高(延遲在1秒內估計就能滿足客戶需求),如果只為這個用途專門配一塊0.6TOPS的加速器就顯得太過奢侈了,因此神經計算引擎應該還會在其他的場合能用上。那麼,其他的應用場合又是哪些呢?是專供蘋果操作系統內部原生app使用,還是會開放給第三方app也能使用?目前這一切都還不得而知,但是蘋果打造神經網路引擎的野心肯定不止於FaceID。

到底有幾個版本A11 Bionic?如果只有一個包含神經網路引擎的版本,那麼在不包含FaceID的iPhone 8上,神經網路引擎一定會要做一些其他事情。如果有兩個版本的A11 (含神經網路引擎的iPhone X版本和不含神經網路引擎的iPhone 8版本),那麼只能說蘋果錢太多,能一次設計兩個版本的晶元!

今天是《半導體行業觀察》為您分享的第1395期內容,歡迎關注。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 公眾號 的精彩文章:

媳婦床上這樣子,丈夫受不了
人月兩團圓,酥皮鮮肉月餅
《幸運鑰匙》上帝的當頭一棒除了敲暈你,有時也是為了能叫醒你
小故事擺脫圍剿——秦國連橫(四)
這是一篇跑題及其嚴重的推送

TAG:公眾號 |