微軟人工智慧系統聯合中心亮相，講述如何打造全棧AI平台

新聞 06-28

（微軟微軟全球執行副總裁、人工智慧及微軟研究事業部負責人沈向洋博士在微軟2018人工智慧大會）

在近來的大會上，微軟反覆強調其全新的世界觀「智能雲&智能邊緣」。在移動互聯網時代掉隊的微軟，似乎要以這個新口號在人工智慧時代脫胎換骨。

然而，以Windows操作系統起家的微軟，並沒有放棄「系統」。2017年，微軟定位北京，成立了微軟亞洲研究院-微軟（亞洲）互聯網工程院人工智慧系統聯合中心，旨在為微軟的AI生態搭建最核心、最基礎的系統平台。

6月20日，微軟亞洲研究院副院長、人工智慧系統聯合中心負責人周禮棟以及其團隊召開了一次深度workshop，向包括雷鋒網在內的十餘家科技媒體介紹微軟如何做「人工智慧時代的系統創新」。

何為系統？微軟給出的定義是系統就是把零散、複雜的個體組織成有序的整體。在計算機領域，不妨將這個抽象又簡單的名詞理解為平台。「一直以來，微軟都是一個平台公司，從早期的操作系統、資料庫，到雲平台、分散式系統，其實都可以被稱為『系統』。」

PC時代有操作系統，互聯網時代有分散式系統，AI對系統提出了新的要求。現階段的人工智慧有三個非常重要的支柱點——大數據、新演算法和大計算。而「系統」作為連接數據和演算法的紐帶，是一個不為大眾所熟知的關鍵要素，一個好的系統可以有效支撐AI應用的架構、開發、部署和落地。

周禮棟介紹道，微軟人工智慧系統聯合中心要做一個全棧的AI平台（AI Stack），可以為AI開發者提供全方位支持，讓廣大AI開發者、AI應用背後的技術團隊，讓他們在開發AI應用時更加得心應手，沒有後顧之憂，目前主要分為三個層次：

一，AI計算能力。從硬體到基礎設施再到管理系統全部覆蓋，充分利用GPU、FPGA等新興技術，以及雲計算、大數據等現有的相對成熟的大規模分散式系統，讓AI的計算能力實現價值最大化。

二，AI平台中間層。其中包括編程語言、各種工具包等，供開發AI演算法的人使用，為他們提供完善的開發和運行環境。

三，AI演算法。提供成熟的AI演算法供應用開發者使用，例如讓微軟認知工具包CNTK與TensorFlow、Caffe等框架實現靈活轉換，在一種框架下訓練好的模型，可以在另一種框架下無縫使用，並將更多演算法集成到Visual Studio中去。

全棧AI平台（AI Stack）體現了微軟的系統理念，連接底層技術和工具包直接提升開發者進行深度學習開發、模型訓練的效率，但是對於開發者來說整個系統又像是無形的、不可見的。這樣的系統思路有助於實現「AI普及化」，打造一個通用AI平台的目標。當然，目前還需要各個層面的協同發展。

雷鋒網了解到，在AI計算能力方面，英特爾、谷歌等主要發力AI晶元，微軟則強調Azure智能雲。Azure智能雲匯聚了微軟在人工智慧領域的大量投入與技術積累，是開發、部署、運行人工智慧的雲平台，同時也是將智能雲與智能邊緣融會貫通的關鍵環節。微軟一直在拓展Azure的功能。

Azure目前有四個方面：公有雲Azure、混合雲Azure Stack、物聯網Azure IoT Edge和Azure Sphere，以這四個方面打造出完整的計算環境，支持全新應用場景。

在AI平台中間層，微軟已有多種工具：Project Brainwave 、ML.NET、ONNX、OpenPAI、Tools for AI、NNI等，都旨在提供更簡易、高效的人工智慧開發工具。

微軟於2017年發布的Project Brainwave能利用Azure上的FPGA基礎架構完成實時的人工智慧處理。用戶只需要通過實時的單一批數據，就能得到以往需要多得多的批量數據處理才能得到的結果。

在Build 2018微軟全球開發者大會上，微軟宣布推出跨平台、開源機器學習框架ML.NET的預覽版。ML.NET讓任何開發者都能開發出自己的定製化機器學習模型，並將其融入到自己的應用中去——開發者完全無需具備開發和調試機器學習模型的經驗。

在隨後的微軟2018人工智慧大會上，微軟介紹了兩個新的工具：Open Platform for AI（OpenPAI）和Tools for AI。

OpenPAI由微軟亞洲研究院和微軟（亞洲）互聯網工程院聯合研發，旨在為深度學習提供一個深度定製和優化的人工智慧集群管理平台，其支持多種深度學習、機器學習及大數據任務，可提供大規模GPU集群調度、集群監控、任務監控、分散式存儲等功能。

Tools for AI也是中國團隊打造，為開發者提供了一個全平台、全軟體產品生命周期、支持各種深度學習框架的開發套件。開發者可以通過熟悉的Visual Studio和Visual Studio Code開發工具，快速開發深度學習相關的程序。Tools for AI的一鍵安裝功能可以幫助開發者配置深度學習的開發環境，配合Visual Studio (Code)自帶的Python語言開發功能，開發者可以方便地編輯和調試基於CNTK、TensorFlow、PyTorch等主流深度學習框架下構建的深度學習訓練程序。

除了以上已經發布的工具外，微軟亞洲研究院資深研究員伍鳴和研究員薛卉在workshop現場演示了微軟在人工智慧系統上的創新。

伍鳴展示了三種深度學習框架後端優化路徑，第一種是一種硬體網路技術RDMA網卡，目前許多以深度學習為目標應用的GPU集群都部署了這樣的網路。為了更好地利用如RDMA、NVLink等的高速網路硬體的能力，微軟設計了一種零拷貝通信機制，將Tensor數據直接傳輸到接收端。經過在TensorFlow上的實驗，該方法在一系列神經網路模型上的收斂速度提高2-8倍。第二種是內核融合，其主要思路是如何自動對任意深度學習網路模型實施優化，提升單個計算單元運算效率，實現約10倍左右的性能加速。第三種是擴展TensorFlow API，使用戶可以在模型腳本中直接控制壓縮和量化，另一個思路是將輸入數據非同步拷貝到CPU中，掩蓋數據拷貝的開銷，這種做法需要和內核融合結合。

研究員薛卉介紹了其開發的NNI。薛卉原本從事自然語言處理，在加入系統組後，從自身在上層技術領域進行科研工作的切身體會出發，和微軟亞洲研究院首席研究員楊懋一起開發了名為Neural Network Intelligence（NNI）的底層框架。NNI項目源起於傳統機器學習開發的繁瑣流程，特別是深度學習目前還處於黑箱狀態，研究人員往往需要花費大量的時間進行模型選擇和超參數調試。NNI的誕生不僅可以支持不同的操作系統和編程語言，自動地幫助使用者完成數據分析、模型比對、參數調試和性能分析工作，還能方便使用者將模型運行在不同的分散式系統上。近期，NNI就會以開源工具包的形式對外發布，這將給研究、開發人員更多嘗試創新的可能性，加快科研和技術發展的腳步。

做系統最重要的是易用性，微軟以上的項目通過系統的優化、創新，能夠賦能更多科研人員、開發者和實踐者。

雷鋒網了解到，目前除了微軟，其他巨頭公司也在積極推廣人工智慧系統/平台，英特爾有其「人工智慧全棧解決方案」，囊括了晶元、處理器、資料庫、開源軟體工具等；蘋果有機器學習框架Core ML、Create ML、對話式人工智慧Siri。未來，人工智慧時代的標誌性系統究竟是什麼樣？還需要我們繼續探索。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 雷鋒網 的精彩文章:

※英特爾正在測試僅為50nm的最小自旋量子位晶元
※羅永浩：堅果 TNT 90% 的差評，反而意味著鎚子科技的機會

TAG:雷鋒網 |