當前位置:
首頁 > 新聞 > 微軟人工智慧系統聯合中心亮相,講述如何打造全棧AI平台

微軟人工智慧系統聯合中心亮相,講述如何打造全棧AI平台

(微軟微軟全球執行副總裁、人工智慧及微軟研究事業部負責人沈向洋博士在微軟2018人工智慧大會)

在近來的大會上,微軟反覆強調其全新的世界觀「智能雲&智能邊緣」。在移動互聯網時代掉隊的微軟,似乎要以這個新口號在人工智慧時代脫胎換骨。

然而,以Windows操作系統起家的微軟,並沒有放棄「系統」。2017年,微軟定位北京,成立了微軟亞洲研究院-微軟(亞洲)互聯網工程院人工智慧系統聯合中心,旨在為微軟的AI生態搭建最核心、最基礎的系統平台。

6月20日,微軟亞洲研究院副院長、人工智慧系統聯合中心負責人周禮棟以及其團隊召開了一次深度workshop,向包括雷鋒網在內的十餘家科技媒體介紹微軟如何做「人工智慧時代的系統創新」。

何為系統?微軟給出的定義是系統就是把零散、複雜的個體組織成有序的整體。在計算機領域,不妨將這個抽象又簡單的名詞理解為平台。「一直以來,微軟都是一個平台公司,從早期的操作系統、資料庫,到雲平台、分散式系統,其實都可以被稱為『系統』。」

PC時代有操作系統,互聯網時代有分散式系統,AI對系統提出了新的要求。現階段的人工智慧有三個非常重要的支柱點——大數據、新演算法和大計算。而「系統」作為連接數據和演算法的紐帶,是一個不為大眾所熟知的關鍵要素,一個好的系統可以有效支撐AI應用的架構、開發、部署和落地。

周禮棟介紹道,微軟人工智慧系統聯合中心要做一個全棧的AI平台(AI Stack)可以為AI開發者提供全方位支持,讓廣大AI開發者、AI應用背後的技術團隊,讓他們在開發AI應用時更加得心應手,沒有後顧之憂,目前主要分為三個層次:

一,AI計算能力。從硬體到基礎設施再到管理系統全部覆蓋,充分利用GPU、FPGA等新興技術,以及雲計算、大數據等現有的相對成熟的大規模分散式系統,讓AI的計算能力實現價值最大化。

二,AI平台中間層。其中包括編程語言、各種工具包等,供開發AI演算法的人使用,為他們提供完善的開發和運行環境。

三,AI演算法。提供成熟的AI演算法供應用開發者使用,例如讓微軟認知工具包CNTK與TensorFlow、Caffe等框架實現靈活轉換,在一種框架下訓練好的模型,可以在另一種框架下無縫使用,並將更多演算法集成到Visual Studio中去。

全棧AI平台(AI Stack)體現了微軟的系統理念,連接底層技術和工具包直接提升開發者進行深度學習開發、模型訓練的效率,但是對於開發者來說整個系統又像是無形的、不可見的。這樣的系統思路有助於實現「AI普及化」,打造一個通用AI平台的目標。當然,目前還需要各個層面的協同發展。

雷鋒網了解到,在AI計算能力方面,英特爾、谷歌等主要發力AI晶元,微軟則強調Azure智能雲。Azure智能雲匯聚了微軟在人工智慧領域的大量投入與技術積累,是開發、部署、運行人工智慧的雲平台,同時也是將智能雲與智能邊緣融會貫通的關鍵環節。微軟一直在拓展Azure的功能。

Azure目前有四個方面:公有雲Azure、混合雲Azure Stack、物聯網Azure IoT Edge和Azure Sphere,以這四個方面打造出完整的計算環境,支持全新應用場景。

在AI平台中間層,微軟已有多種工具:Project Brainwave 、ML.NET、ONNX、OpenPAI、Tools for AI、NNI等,都旨在提供更簡易、高效的人工智慧開發工具。

微軟於2017年發布的Project Brainwave能利用Azure上的FPGA基礎架構完成實時的人工智慧處理。用戶只需要通過實時的單一批數據,就能得到以往需要多得多的批量數據處理才能得到的結果。

在Build 2018微軟全球開發者大會上,微軟宣布推出跨平台、開源機器學習框架ML.NET的預覽版。ML.NET讓任何開發者都能開發出自己的定製化機器學習模型,並將其融入到自己的應用中去——開發者完全無需具備開發和調試機器學習模型的經驗。

在隨後的微軟2018人工智慧大會上,微軟介紹了兩個新的工具:Open Platform for AI(OpenPAI)和Tools for AI。

OpenPAI由微軟亞洲研究院和微軟(亞洲)互聯網工程院聯合研發,旨在為深度學習提供一個深度定製和優化的人工智慧集群管理平台,其支持多種深度學習、機器學習及大數據任務,可提供大規模GPU集群調度、集群監控、任務監控、分散式存儲等功能。

Tools for AI也是中國團隊打造,為開發者提供了一個全平台、全軟體產品生命周期、支持各種深度學習框架的開發套件。開發者可以通過熟悉的Visual Studio和Visual Studio Code開發工具,快速開發深度學習相關的程序。Tools for AI的一鍵安裝功能可以幫助開發者配置深度學習的開發環境,配合Visual Studio (Code)自帶的Python語言開發功能,開發者可以方便地編輯和調試基於CNTK、TensorFlow、PyTorch等主流深度學習框架下構建的深度學習訓練程序。

除了以上已經發布的工具外,微軟亞洲研究院資深研究員伍鳴和研究員薛卉在workshop現場演示了微軟在人工智慧系統上的創新。

伍鳴展示了三種深度學習框架後端優化路徑,第一種是一種硬體網路技術RDMA網卡,目前許多以深度學習為目標應用的GPU集群都部署了這樣的網路。為了更好地利用如RDMA、NVLink等的高速網路硬體的能力,微軟設計了一種零拷貝通信機制,將Tensor數據直接傳輸到接收端。經過在TensorFlow上的實驗,該方法在一系列神經網路模型上的收斂速度提高2-8倍。第二種是內核融合,其主要思路是如何自動對任意深度學習網路模型實施優化,提升單個計算單元運算效率,實現約10倍左右的性能加速。第三種是擴展TensorFlow API,使用戶可以在模型腳本中直接控制壓縮和量化,另一個思路是將輸入數據非同步拷貝到CPU中,掩蓋數據拷貝的開銷,這種做法需要和內核融合結合。

研究員薛卉介紹了其開發的NNI。薛卉原本從事自然語言處理,在加入系統組後,從自身在上層技術領域進行科研工作的切身體會出發,和微軟亞洲研究院首席研究員楊懋一起開發了名為Neural Network Intelligence(NNI)的底層框架。NNI項目源起於傳統機器學習開發的繁瑣流程,特別是深度學習目前還處於黑箱狀態,研究人員往往需要花費大量的時間進行模型選擇和超參數調試。NNI的誕生不僅可以支持不同的操作系統和編程語言,自動地幫助使用者完成數據分析、模型比對、參數調試和性能分析工作,還能方便使用者將模型運行在不同的分散式系統上。近期,NNI就會以開源工具包的形式對外發布,這將給研究、開發人員更多嘗試創新的可能性,加快科研和技術發展的腳步。

做系統最重要的是易用性,微軟以上的項目通過系統的優化、創新,能夠賦能更多科研人員、開發者和實踐者。

雷鋒網了解到,目前除了微軟,其他巨頭公司也在積極推廣人工智慧系統/平台,英特爾有其「人工智慧全棧解決方案」,囊括了晶元、處理器、資料庫、開源軟體工具等;蘋果有機器學習框架Core ML、Create ML、對話式人工智慧Siri。未來,人工智慧時代的標誌性系統究竟是什麼樣?還需要我們繼續探索。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

英特爾正在測試僅為50nm的最小自旋量子位晶元
羅永浩:堅果 TNT 90% 的差評,反而意味著鎚子科技的機會

TAG:雷鋒網 |