蘋果神經引擎晶元A11 Bionic有什麼用？詳細解釋一下

科技 09-18

騰訊數碼訊（黑子）蘋果最近舉行了發布會，推出iPhone X和iPhone 8，同時蘋果還推出A11 Bionic晶元，這是一個6核CPU，它是蘋果的定製GPU，蘋果管它叫作「Neural Engine」（神經引擎）。對於這個新硬體，蘋果沒有談太多，只是說：

「新A11 Bionic神經引擎採用多核設計，實時處理速度最高每秒可以達到6000億次。A11 Bionic神經引擎主要是面向特定機器學習演算法、Face ID、Animoji及其它一些功能設計的。」

上面所說的話基本都是宣傳資料。所謂的每秒運算6000億次對你來說沒有任何意義。當然，這個數字應該是真實的，但是它並不能告訴我們底層架構是怎樣的、真實性能又是怎樣的，因為我們不知道蘋果所謂的「運行」到底是什麼意思。當我們談論GPU性能，會用TFLOPs評估，例如，廠商會提供GPU在理想環境下執行浮點運算的速度。一般來說，執行特定任務時，GPU的表現與理論數據有差距，就蘋果晶元來說應該也是一樣的。

到底蘋果硬體的具體規格如何？我們無法確切知道，儘管如此，我們還是可以推斷一下。

機器學習是AI技術的分支，它的目標是創建演算法，讓演算法通過數據自動學習。機器學習的種類很多，其中有兩種尤其引人關注，一種是監督式學習，一種是無監督學習。

如果是監督式學習，處理的數據已經貼上標籤，分了類。例如，如果你擁有某個城市的資料庫，它會告訴你公寓的租賃情況，還有每個公寓佔地面積是多少。如果你將這些數據放進演算法，用於監督式學習，它會在佔地面積與租賃情況之間構建圖表，將二者聯繫起來，你給它一個面積，它可以預測相對應的租賃情況，不需要再寫一個特定程序執行相同的任務。你可能會向模型下命令，讓它預測1000平方英尺的公寓租金是多少，然後查看1000平方英尺的公寓實際租金是多少，用查到的數據對預測進行檢查。輸入模型的數據越多，模型越出色，預測的結果越精準。

如果是無監督學習，輸給演算法訓練的數據沒有貼標籤。在監督式學習中，你知道自己想在面積與月租金之間建立聯繫。如果是非監督式學習，你不知道每個數值與什麼有關。此時演算法會在數據內尋找關係。

讓我們舉一個例子。假設你有一個更大的資料庫，不只包含平方面積和公寓租賃數據，還有其它數據。比如本地房產的估價數據、犯罪率數據、人口統計數據、學校質量數據、月租金數據、信用評估數據。所有這些因素都會影響公寓的租賃價格，不過各因素的影響到底有多大呢？很難確定。此時，你可能想開發一套演算法，將各因素的關係勾勒出來，將相似的結果歸成一類，讓關係突顯出來。這就是所謂的「clustering」（分類歸併），它是無監督學習演算法的一種基本類型。

上圖告訴我們同一數據集分類歸併之前和之後的形態。Clustering只是一種類型的無監督學習演算法，沒有任何一種演算法是完美的，各有優缺點，有時演算法找到的關係只是「背景噪音」，沒有價值。Netflix、亞馬遜用推薦引擎推薦產品和服務，它用的就是這種類型的演算法。

例如，如果你正在觀看《星際迷航》，Netflix怎麼知道你喜歡《神盾局特工》呢？因為Netflix拿到了觀眾的數據，知道它們有關係。如果你知道《星際迷航》影迷有90%看了漫威劇集，你就知道自己應該向他們推薦更多漫威影片。如果處理的數據點只有一個或者兩個，要找到這種聯繫似乎很簡單。如果有成百上千個數據點呢？那就麻煩了，此時機器學習能發揮作用。

面部識別是深度學習、機器學習、AI的主要研究領域之一。正因如此，蘋果才會說它的神經引擎用在Face ID上，或者說它是它是專門用來執行特定演算法的。Animojis到底有什麼作用？現在還不太清楚，讓我們先放在一邊不去理會。

蘋果曾說過，Face ID不只使用了傳統攝像頭。按照蘋果的描述，新技術用3萬個紅外光點給面部繪圖，這些圖像存儲起來，當你解鎖設備，系統會將存儲的圖像與它看到的臉部圖像對比。整個過程有大量數據需要處理，而且還不能消耗太多的電能。

有許多公司也在研究如何將AI、深度學習、機器學習技術應用於硬體。谷歌開發了Tensorflow、英特爾開發了MIC、Nvidia開發Volta、富士通也在搭建自己的解決方案，甚至連AMD都想將深度學習技術放進Radeon Instinct產品。這些硬體解決方案到底有何區別，我沒法一一介紹。深度學習的推斷方式、訓練深度學習的模型是不同的，這些平台的能力也不一樣，它們無法裝進相同的硬體，解決相同的問題。

並不是說它們沒有相似的地方。大體來說，這些技術瞄準的都是硬體的特定功能，目標是縮短計算時間，降低計算能耗。與Nvidia Volta和AMD Radeon Instinct對比，蘋果A11 Bionic的TDP（熱設計功耗）肯定不同，降低每次運行的能耗至關重要。下面的圖表告訴我們執行特定運算需要消耗多少電能。AMD與Nvidia積極倡導16位運算，為什麼？看看下圖就知道了，左邊「Operation」一欄指的是執行的運算，「Energy」指的是能耗，「Relative Energy Cost」說的是執行運算需要的能耗；「Area」代表面積，「Relative Area Cost」指出執行相應運算硬體需要多少面積。

要提高機器學習的運算性能與效率，將數據存放在本地也很關鍵。匯流排中傳輸的數據越少，能耗越低。為了構建一個「低能耗網路」，企業們花了很多精力研究。蘋果之所以想為設備引進AI與機器學習技術也是出於這個原因，因為電能有限，提高效率至關重要，它還可以為AI、HPC留下發展空間。如果能夠構建低能耗網路，未來可以輕鬆將CPU放進更大的設備，或者提高CPU的運行速度，但是不會產生更多的熱量。

要提高機器學習的運算性能與效率，將數據存放在本地也很關鍵。匯流排中傳輸的數據越少，能耗越低。目前我們看到的架構全都是高度並行的架構，它們同步計算大型數據集，目標不是提高頻率、減少線程。

在過去幾年裡，許多企業開始研究深度學習、機器學習、AI。當中一些用來執行特殊任務，比如讓無人駕駛汽車行駛。為什麼會出現這樣的熱潮呢？之前硅晶元的性能提升很快，2004年之後形勢變了，之後很長一段時間增長變慢。從2004年到2011年，企業增加CPU內核、改進架構，進步的速度還算可以。但是到了2011年之後，高端CPU的單線程速度止步不前，前進速度像烏龜一樣。AMD Ryzen做得不錯，它在消費市場恢復了一點生機，但在純粹的單線程性能上AMD還沒有打敗英特爾。

如何讓晶元繼續前進呢？有三種趨勢越來越明顯。

首先，要提高計算性能，只能開發新的軟體模型，用新的特殊內核運行軟體模型。曾幾何時通用CPU飛速進步，如果這種進步無法重現，也許特殊、執行特定任務的內核可以讓性能快速提升。

其次，晶體管密度繼續提高，能耗繼續降低，晶元可以收集更多數據，以更快的速度處理數據，之前我們做不到，因為受到能耗的制約，也沒有可以處理的硬體。

再次，消費PC相當於處理「中心」，但是雲數據中心對數據集中處理，正因如此，微軟、谷歌等企業才會想著開發特殊硬體，執行特定處理任務。英特爾不會開發一款特殊CPU，為搜索引擎的後端處理做優化，製造這樣的晶元沒有市場。微軟不同，早在2015年，它就用FPGAs技術提高必應的性能。

蘋果所走的道路與數據中心所走的路沒有什麼不同，不過走這條路的不只有蘋果。高通之前也曾說過，驍龍835是一個平台，裡面有許多計算功能開發者可以拿去用。未來蘋果會如何強化該技術，我們拭目以待。雖然蘋果已經遠離外設業務，不代表它未來某一天不會回來，它可能會推出高頻版A11 Bionic，裝進附件，手機對TDP有要求，對外形有要求，附件不會有這樣的要求。

來源：extremetech

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 騰訊數碼 的精彩文章:

※DeLight智能自行車燈同時保護你和車的安全
※用AI診斷老年痴呆要比醫生提前十年
※反悔已成常態看看這幾年蘋果前後矛盾的產品和技術
※Windows混合現實要來了：這些知識需要補補課
※安卓用戶是這樣看iPhone X的：「我不會被它吸引」

TAG:騰訊數碼 |

蘋果神經引擎晶元A11 Bionic有什麼用？詳細解釋一下

什麼是機器學習

為什麼開發特殊硬體

為什麼現在推出？