AI晶元界的老大又把魔爪伸向了機器人

最新 06-11

AI晶元之於人工智慧的意義，則可以理解為發動機之於汽車。人工智慧這一理論已經提出了多年，但是由於實現它需要的計算量實在太大，這輛「跑車」一直沒有配備上合適的「發動機」，只能放在倉庫積灰。直到AI演算法和大數據時代的到來、以及AI晶元的出現。

第三波AI浪潮的發展主要由深度學習技術的突破引領，而英偉達（Nvidia）憑藉其通用的GPU單元，專門的TensorRT加速器，強勁的矩陣運算性能加上對其他演算法的兼顧，英偉達不僅能用GPU滿足AI構建的訓練需求，還能用TeslaRT用來部署，很好實現AI構建，所以英偉達也率先成了這一波AI熱潮的最大受益者。

給機器人「造腦」，英偉達發布全新AI晶元Jetson Xavier

近日，英偉達正式發布了一款全新AI晶元—Jetson Xavier，Jetson Xavier作NVIDIA Isaac平台的核心，是全球首款專為機器人設計的計算機。該公司CEO黃仁勛在周一的新聞發布會上表示：「這台小電腦，將成為未來機器人的大腦」。

Jetson Xavier包含了六顆處理器，包括1個Volta Tensor Core GPU、1個8核ARM64 CPU、2個NVDLA深度學習加速器、1個圖像處理器、1個視覺處理器和1個視頻處理器，每秒可執行30萬億次操作。為了打造它，Nvidia足足耗費了五年的時間——三年設計、兩年築造，共有超過8000人參與了設計與開發，可以說這是Nvidia單獨做過的最長的一個處理器項目。它的處理能力與配備了10萬美元GPU的工作站大致相同，但功率僅為30瓦。

簡而言之，就是Nvidia成功地將1000瓦性能的10萬美元級工作站，縮小到了30瓦的『掌中寶』的程度。

NVIDIA為Jetson Xavier的模擬、訓練、驗證和部署提供了一個工具箱。該機器人軟體包含Isaac SDK、Isaac IMX、Isaac Sim三方面內容：

Isaac SDK：一套API和工具，可藉助全面加速的庫，開發機器人演算法軟體及運行時框架。

Isaac IMX：Isaac智能機器加速應用，是NVIDIA開發的機器人演算法軟體的集合。

當前Nvidia的技術，已經被一些企業用於自主倉庫機器人、機器採摘和農業機器人。不過黃仁勛表示，JetsonXavier要比之前的AI晶元要強大20倍。

Isaac Sim：高度逼真的虛擬模擬環境，可供開發者訓練自主機器，並使用Jetson Xavier進行硬體在環測試。

提早轉型，英偉達開啟人工智慧之路

作為一家圖像處理晶元公司，Nvidia約在7年前就已經開始轉型布局人工智慧。當時人工智慧概念還未興起，AI仍是一片藍海。經過持續多年的研發，公司在近年來陸續推出人工智慧晶元、系統、軟體和服務，打造世界頂級人工智慧公司。

2009年英偉達Tegra進入奧迪汽車

德國大眾為旗下的奧迪汽車引入新式導航系統，並首次採用NVIDIATegra片上系統處理器。相比於2009年初的多媒體交互系統(MMI)，新的Tegra核心導航系統自然要更加高級，不但功能上更強大，效果也應該更酷一些。

在後來的GTC 2014大會上，奧迪自動駕駛汽車再次展示了基於Tegra K1開發套件的車載智能系統，可提供自動駕駛、導航、碰撞感應、智能鏈接等功能。

2013年11月 IBM和英偉達聯合開發超級計算機

IBM與晶元廠商英偉達Nvidia達成戰略合作，共同設計開發新型超級計算機系統和伺服器。英偉達開發的圖形處理單元晶元(GPU)，很好適用於浮點計算，表現勝於英特爾的傳統CPU Xeon和AMD的Opteron。排名第二位的「泰坦」也搭載了GPU。

根據IBM和英偉達合作內容，雙方在晶元方面就行合作，通過技術共享，讓英偉達的Tesla GPU更好與前者的Power 8晶元協同工作。

早期的Tesla車型曾使用過Tegra 2，但處理能力遠遠不夠，所以後來升級到了Tegra 3。特斯拉Model S電動車的車載娛樂系統也是基於Tegra 3設計。Nvidia基於在圖形處理方面長期積累與CUDA架構，和特斯拉建立密切的合作。而特斯拉為Nvidia在高度智能化的汽車上的布局上起到助推作用。

2014年早期特斯拉ModelS搭載英偉達Tegra 3

Nvidia不僅在硬體上有布局，同時已經滲透到了軟體層面。Nvidia將一輛Jeep進行深度改裝，但改的不是發動機、輪轂或包圍，而是中控系統。改裝後的Jeep採用3D列印製造出的中控台，搭配一個17英寸的電容屏。屏幕劃分為3個區域，上中下分貝顯示地圖、娛樂信息以及HVAC（比如空調控制）。配合Tegra K1，Nvidia直接切入到了車輛的CAN匯流排中，實現了對整個車輛的控制。

2014年初，世界上採用NVIDIA處理器的汽車已經超過450萬輛，涉及20多個品牌、100多款車型，其中包括奧迪、寶馬、大眾等車企巨頭，也包括特斯拉這種車界新貴。2015年，Tegra晶元在汽車領域發展加快，在道路上跑的汽車有超過800萬輛搭載Tegra晶元。2015年第三季度Nvidia在汽車領域的業務銷量增長了51%。

2015年12月 Facebook開源BigSur

Facebook研發代號為「BigSur」的新一代硬體的設計目標是訓練神經網路。除人工智慧外，這一技術還經常被稱作機器或深度學習。Facebook與Nvidia進行合作，是第一家採用英偉達TeslaM40GPU加速器的廠商。M40GPU面向深度神經網路，是BigSur平台和OpenRack兼容硬體的關鍵。

採用M40的BigSur平台的速度是該Facebook上一代產品的2倍，使得訓練規模相當於原來2倍的神經網路的速度提高1倍。BigSur是第一款針對機器學習、人工智慧研究開發的開放源代碼計算系統，Facebook將把設計材料提交給開放計算項目。

2016年新款特斯拉model S採用Tegrak1

2016年新款狀態顯示器解析度升級，從過去的1280x480 升級到1920x720，因此副處理器也從Tegra 2升級為Tegra 3，主處理器從Tegra 3升級到了Tegra k1 從而更好地支持自動輔助駕駛功能。

Tesla P40、Tesla P4高性能計算卡

2016年9月，NVIDIA發布新一代高性能計算卡Tesla P40、Tesla P4，它們倆將取代上代麥克斯韋架構的Tesla M40/M4，進化到最新的帕斯卡架構，擁有16nm工藝。這兩款計算卡主要負責圖像、文字和語音識別，專為人工智慧、深度學習、神經網路推演而生。

Tesla P4及P40特別針對推論設計，使用經訓練的深度神經網路識別語音、影像及文字以回應使用者和裝置要求。Pascal架構GPU具備以8位(INT8)運算為主的專門推論指令，提供比CPU快45倍的反應速度，與不到一年前推出的GPU解決方案相比則提升了4倍。

深度學習超級計算機NVIDIADGX-1

深度學習最苛刻的部分是訓練。NVIDIA專為深度學習設計的PASCAL架構，助推深度學習加速高達65倍，並且能夠支持每個主要的深度學習框架。在此架構基礎上，NVIDIA創造了專為GPU深度學習所設計的超級計算機DGX1。

NVIDIA的DGX-1基於Tesla P100加速卡(研發費用高達20億美元）是世界上首款專為深度學習而打造的系統，具備全面集成的硬體和軟體，可以輕鬆快速地完成部署。NVIDIADGX-1革命性的性能可大幅加快訓練速度，成為世界上首款體積小性能強（單機箱）的深度學習超級計算機。

協同駕駛AI Co-Pilot

XAVIER已經被英偉達安裝在一輛基於林肯MKC所打造的自動駕駛測試車BB8上，另外，英偉達還將在自動駕駛領域同奧迪展開合作，其全自動駕駛汽車預計將在2020年上路。

AI Co-Pilot（人工智慧協同駕駛）系統該系統具有人臉識別、頭部追蹤、視線追蹤等功能，能在行車中輔助駕駛者，提高駕駛安全性與便利性。AI Co-Pilot還能在複雜的雜訊環境中通過讀唇獲知駕駛者的需求，準確率已達93.4%。

英偉達的優勢真的是無人能擋嗎？

英偉達上周發布的第一季財報再次超出業界預期，財報顯示這一季度總收入增長了66%，其中數據中心業務營收增長71%達到7.01億美元。英偉達的數據中心業務包含HPC（高性能計算）、數據中心GPU以及AI加速器即使相比過去幾年2-3倍的增長率要少很多，但極具潛力的AI晶元市場空間依舊吸引了眾多巨頭和創業者的參與。

不過英偉達現在具有優勢並不意味著AI市場的蛋糕會被英偉達獨吞，無論是科技巨頭英特爾、谷歌、IBM、AMD還是OURS、地平線、寒武紀等初創企業都紛紛加入了AI晶元領域的競爭。

英特爾這幾年也是卯足了勁入軍AI市場，英特爾的All in AI實力也是不容小覷。除了鞏固資深的優勢產品以外，還進行了一系列的收購以增強自己的能力。英特爾針對已有的優勢產品XeonPhi加速計算卡、收購的Altera FPGA、 Nervana System幾大產品線進行深度學習的優化，從AI構建的訓練和部署都能夠看出這均與英偉達形成競爭，在自動駕駛應用場景中也通過收購Mobileye與英偉達形成強競爭關係。同時還基於FPGA打造自己在AI領域的特色，對人工智慧初創晶元企業的持續投資也有助於英特爾在AI晶元領域實現後來居上。

除了英特爾All In AI全面叫板英偉達，眾多初創公司也會成為挑戰英偉達不可忽視的對手。

以2017年由兩位華人在美國矽谷創立的OURS為代表，OURS以低功耗端計算AI晶元為核心技術，目標是解決工業/商業、機器人、汽車自動駕駛、安防等領域的3D機器視覺和多感測器融合的問題。OURS的核心技術之一就是硅光技術，這一技術很適合於計算機內部和多核之間的大規模通信，其最大的優勢在於擁有相當高的傳輸速率，可使處理器內核之間的數據傳輸速度比目前快 100 倍甚至更高。OURS 採用的是以數據為中心的RISC-V 計算機指令集架構，這也是OURS的另一大核心優勢。

寒武紀近日也發布了一款雲端智能晶元Cambricon MLU100，詞雲端晶元也延續了寒武紀產品通用性的特點，支持各類深度學習和經典機器學習演算法，滿足視覺、語音、自然語言處理、經典數據挖掘等領域複雜場景下（如大數據量、多任務、多模態、低延時、高通量）的雲端智能處理需求。

不只是硬體，寒武紀還努力實現軟硬體的協同工作，寒武紀從 2016 年起逐步推出了寒武紀 NeuWare 軟體工具鏈，該平台終端和雲端產品均支持，可以實現對 tensorflow、caffe 和 mxnet 的 API 兼容，同時提供寒武紀專門的高性庫，可以方便地進行智能應用的開發，遷移和調優。

小結

AI晶元全球起步時間幾乎同步，此時，人工智慧領域尚未出現「獨步天下」的國際巨頭。但是也要警惕「全民造芯」虛火，目前還沒有出現像CPU（中央處理器）一樣的AI通用演算法晶元，AI的殺手級應用還沒出現，未來這個產業還有很長一段路要走。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 21ic電子網 的精彩文章:

※ARM處理器上的linux內核是怎麼啟動的
※史詩收購案大結局：博通交罰款、高通渾身帶傷

TAG:21ic電子網 |