一文讀懂深度學習，值得收藏！

最新 03-23

第906期推文

導語：近年來人工智慧和深度學習很受關注，晶元廠商也在推出適用於深度學習的處理器，各企業在自己突圍技術難關之外，也在尋求合作，期望能夠通過互補取得更大進步和成績。

本文編輯 Carol

資料來源網路整理

轉載請註明來源芯師爺

今天，中天微宣布與深鑒科技達成一項知識產權合作框架協議，雙方將利用各自在嵌入式通用處理器以及深度學習處理方面的技術優勢，合作構建具有中國知識產權的人工智慧SoC平台與解決方案。

中天微成立於2001年，是一家從事32位高性能低功耗嵌入式CPU研發的集成電路設計公司，中國內地基於自主指令架構研發嵌入式CPU，並實現大規模量產的供應商。截至目前，基於C-SKY CPU的SoC晶元累計出貨量已經突破7億顆。

深鑒科技成立於2016年，提供先進的神經網路深度壓縮技術和基於其自主研發的Aristotle架構和Descartes架構的高效深度學習加速器全棧式解決方案，可在極低的功耗下提供接近高端GPU的深度學習處理性能。

此次合作，中天微將在內置其高性能嵌入式CPU IP的SoC平台中，納入深鑒科技的Aristotle架構DPU深度學習處理器IP，為客戶提供高性能低功耗的嵌入式人工智慧SoC解決方案。

同時，深鑒科技將為中天微的客戶提供其DPU IP的軟硬體集成、軟體開發工具鏈、以及人工智慧演算法優化等全方位的技術支持，以縮短客戶晶元的面世時間，減少客戶晶元的研發風險。

什麼是深度學習？

官方定義，深度學習（Deep Learning）（也稱為深度結構學習【Deep Structured Learning】、層次學習【Hierarchical Learning】或者是深度機器學習【Deep Machine Learning】）是一類演算法集合，是機器學習的一個分支。它嘗試為數據的高層次摘要進行建模。

機器學習（Machine Learning）是一門專門研究計算機怎樣模擬或實現人類的學習行為，以獲取新的知識或技能，重新組織已有的知識結構使之不斷改善自身的性能的學科。

深度學習是機器學習中一種基於對數據進行表徵學習的方法。觀測值（例如一幅圖像）可以使用多種方式來表示，如每個像素強度值的向量，或者更抽象地表示成一系列邊、特定形狀的區域等。而使用某些特定的表示方法更容易從實例中學習任務（例如，人臉識別或面部表情識別）。深度學習的好處是用非監督式或半監督式的特徵學習和分層特徵提取高效演算法來替代手工獲取特徵。

深度學習的應用

在實際應用中，很多問題都可以通過深度學習解決。那麼，我們舉一些例子：

黑白圖像的著色

深度學習可以用來根據對象及其情景來為圖片上色，而且結果很像人類的著色結果。這種解決方案使用了很大的卷積神經網路和有監督的層來重新創造顏色。

機器翻譯

深度學習可以對未經處理的語言序列進行翻譯，它使得演算法可以學習單詞之間的依賴關係，並將其映射到一種新的語言中。大規模的LSTM的RNN網路可以用來做這種處理

圖像中的對象分類與檢測

這種任務需要將圖像分成之前我們所知道的某一種類別中。目前這類任務最好的結果是使用超大規模的卷積神經網路實現的。突破性的進展是Alex Krizhevsky等人在ImageNet比賽中使用的AlexNet模型。

自動產生手寫體

這種任務是先給定一些手寫的文字，然後嘗試生成新的類似的手寫的結果。首先是人用筆在紙上手寫一些文字，然後根據寫字的筆跡作為語料來訓練模型，並最終學習產生新的內容。

自動玩遊戲

這項任務是根據電腦屏幕的圖像，來決定如何玩遊戲。這種很難的任務是深度強化模型的研究領域，主要的突破是DeepMind團隊的成果。

聊天機器人

一種基於sequence to sequence的模型來創造一個聊天機器人，用以回答某些問題。它是根據大量的實際的會話數據集產生的。

深度學習對硬體的需求

一般來說，深度學習包含兩個階段：數據訓練和推斷。

在數據訓練階段，大量的標記或者未標記的數據被輸入深度神經網路中進行監督或者無監督的學習。所謂監督學習，就是輸出是有標記的學習，讓模型通過訓練，迭代收斂到目標值；而非監督學習不需要人為輸入標籤，模型通過學習發現數據的結構特徵。從而使機器能夠在大數據中提取更多的特徵值。

隨著深度神經網路模型層數的增多，與之相對應的權重參數成倍的增長，從而對硬體的計算能力有著越來越高的需求，尤其是在數據訓練的階段。因此，深度學習訓練領域的前沿逐漸從演算法轉移到了對於高性能計算（HPC）的追逐上。目前被業內廣泛接受的是「CPU+GPU」的異構模式和「MIC （Many Integrated Core）」眾核同構來實現高性能計算。

推斷階段就是利用訓練中所獲得的特徵值去對新的輸入數據進行判斷或者預測。從應用上來說，推斷可以分為兩大類：線上數據中心的推斷和移動設備中的推斷。

相較於訓練階段執著於對高性能計算的需求，線上數據中心的推斷不僅要求硬體有著高性能計算，更重要的是對於多指令數據的處理能力。就比如「Bing」搜索引擎同時要對數以萬計的圖片搜索要求進行識別推斷從而給出搜索結果。目前而言，「CPU+GPU」的異構模式依舊是第一選擇，但是「CPU+FPGA」異構計算已經顯示出他在這方面的潛力。

而移動設備中的推斷更強調在高性能計算和低功耗中尋找一個平衡點。在這個領域的深度學習的執行還是更多的依賴於「CPU+FPGA」與「ASIC」。

哪些晶元商在關注深度學習

目前關注深度學習市場的的晶元廠商有哪些呢？英偉達、谷歌、微軟、IBM、寒武紀、地平線、中星微、英特爾等。其中英偉達進入市場較早，Intel 2016年以4.08 億美元收購Nervana Systems開始進行布局。

寒武紀，是北京中科寒武紀科技有限公司的簡稱。2016年推出的寒武紀1A處理器（Cambricon-1A）是世界首款商用深度學習專用處理器，面向智能手機、安防監控、可穿戴設備、無人機和智能駕駛等各類終端設備。

Horizon Robotics（地平線機器人）由前百度深度學習研究院負責人余凱創辦，致力於打造基於深度神經網路的人工智慧「大腦」平台-包括軟體和晶元，可以做到低功耗、本地化的解決環境感知、人機交互、決策控制等問題。

地平線的最終產品不止晶元，而是一個核心控制模塊，具有感知、識別、理解、控制的功能。把這個控制模塊做成產品去跟合作方做集成。換句話說，地平線提供的是一個帶有人工智慧演算法的解決方案。

中星微在2016年6月20日率先推出中國首款嵌入式神經網路處理器（NPU）晶元，這是全球首顆具備深度學習人工智慧的嵌入式視頻採集壓縮編碼系統級晶元，取名「星光智能一號」。

這款基於深度學習的晶元運用在人臉識別上，最高能達到98%的準確率，超過人眼的識別率。該NPU採用了「數據驅動」並行計算的架構，單顆NPU（28nm）能耗僅為400mW，極大地提升了計算能力與功耗的比例。

今天獲得消息，三星電子推出新款處理器Exynos7 9610，採用10納米工藝，配置基於深度學習的技術，估計未來也會有更多企業開始關注深度學習領域。

本文內容綜合自SIMTAC、基數智能、如有侵權請聯繫處理，謝謝！

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 芯師爺 的精彩文章:

※智能手機僅作為通信中心？聽聽博世大佬怎麼說！
※如何通過感測器控制車內溫度，一定要看

TAG:芯師爺 |