當前位置:
首頁 > 最新 > 微軟Azure現在支持Nvidia的GPU Cloud進行深度學習模型的訓練和推理

微軟Azure現在支持Nvidia的GPU Cloud進行深度學習模型的訓練和推理

編譯:chux

出品:ATYUN訂閱號

Microsoft Azure雲客戶現在可以使用Nvidia的GPU Cloud進行深度學習模型的訓練和推理。

Nvidia GPU Cloud提供軟體容器,以加速研究人員和開發人員的高性能計算(HPC)和深度學習。由Nvidia Volta及其Tensor Core GPU架構提供支持的GPU Cloud於2017年春季推出。

Nvidia容器註冊表支持流行的深度學習工具,如TensorFlow,Microsoft Cognitive Toolkit和PyTorch。像Tesla V100這樣的Nvidia晶元在今天的許多世界上最大的超級計算機中使用,並且與其他圖形處理單元晶元一起,對於提高計算能力以實現深度學習至關重要。

據博客文章稱,微軟今天宣布推出Azure CycleCloud,這是一款用於管理Azure中高性能計算集群的工具。

目前,Azure推動高性能和加速計算的新領域,大量客戶正在利用Azure實現突破性創新。

微軟在公共雲中提供最廣泛的加速和高性能計算(HPC)功能。從用於AI和HPC的支持InfiniBand的虛擬機系列到用於Cray超級計算的超大規模服務,Azure使客戶能夠提供全方位的AI和機器學習應用程序。


Azure CycleCloud具有普遍可用性,這是一個用於創建,管理,操作和優化Azure中任何規模的HPC群集的工具。

藉助Azure CycleCloud,每個人更輕鬆地部署,使用和優化HPC群集。對於運行傳統HPC群集的用戶,使用包括SLURM,PBS Pro,Grid Engine,LSF,HPC Pack或HTCondor的調度程序,這將是在雲中啟動和運行群集以及管理計算/數據工作流的最簡單方法,實現用戶訪問許可權以及減少HPC工作負載的成本。

只需點擊幾下,HPC IT管理員就可以在Azure中部署高性能的計算,存儲,文件系統和應用程序功能集群。Azure CycleCloud基於角色的策略和治理功能使其組織可以輕鬆地在需要時提供混合計算能力,同時避免失控的成本。用戶可以依靠Azure CycleCloud來協調跨這些群集的作業和數據工作流。


由於GPU為AI和HPC提供了出色的性能,因此Microsoft Azure提供了各種支持NVIDIA GPU的虛擬機。從今天開始,Azure用戶和雲開發人員通過功能強大的GPU優化軟體,充分利用Azure上支持的NVIDIA GPU,提供了一種加速AI和HPC工作流程的新方法。

現在,NVIDIA Volta和Pascal支持的Azure NCv3,NCv2和ND支持來自NVIDIA GPU雲(NGC)容器註冊表的容器。這將Azure雲基礎架構中NVIDIA GPU的強大功能與來自NGC的綜合深度學習庫和HPC容器結合在一起。

NGC容器註冊表包括NVIDIA經過調整,測試和認證的容器,用於深度學習軟體,如Microsoft Cognitive Toolkit,TensorFlow,PyTorch和NVIDIA TensorRT。通過廣泛的集成和測試,NVIDIA為每個框架創建了一個最佳軟體堆棧(包括所需的操作系統補丁,NVIDIA深度學習庫和NVIDIA CUDA工具包),使容器能夠充分利用NVIDIA GPU。NGC的深度學習容器每月更新一次,包含最新的軟體和組件更新。

NGC還為HPC提供經過全面測試的GPU加速應用程序和可視化工具,如NAMD,GROMACS,LAMMPS,ParaView和VMD。這些容器簡化了部署,使你可以使用最新功能快速啟動和運行。

為了便於在Azure中使用NGC容器,Azure Marketplace上提供了一個名為NVIDIA GPU Cloud Image for Deep Learning和HPC的新映像。此映像提供了一個預配置的環境,用於在Azure上使用來自NGC的容器。Azure NCv2,NCv3和ND虛擬機上的NGC容器也可以通過遵循這些GitHub指令與Azure Batch AI一起運行。

要從此映像訪問NGC容器,只需註冊一個免費帳戶,然後將容器拉入Azure實例。要了解有關使用Azure和NGC加速HPC和AI項目的更多信息,請在10月2 日註冊參加網路研討會。

Microsoft致力於使Azure成為HPC的首選雲。Azure CycleCloud和NVIDIA GPU簡化了集成以及管理和擴展的能力。使用Avere vFXT實現混合雲性能的近期發展將增強最小化延遲的能力,同時利用本地NAS或Azure blob存儲以及Azure CycleCloud和Azure Batch工作負載。

在最近在雲中提供深度學習的其他工作中,微軟今年早些時候推出了Project Brainwave,這是一項Azure服務,用於服務由英特爾Stratix 10現場可編程門陣列(FPGA)晶元驅動的AI模型,旨在提供比CPU更快的性能或GPU。

高性能計算在當今的各個領域都有應用,包括為醫療和醫學研究提供動力,如藥物發現,為軍隊和政府運行複雜的模擬,以及執行金融解決方案。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 ATYUN訂閱號 的精彩文章:

馬斯克等2400人以及160多家公司簽署承諾,不參與也不支持自主武器開發
LG首席技術官詳解公司的AI優先策略

TAG:ATYUN訂閱號 |