如何從零開始配置一台適用於深度學習的GPU伺服器?
作者 | 蔡芳芳
計算力正在推動人工智慧飛速發展,GPU 深度學習可以說點燃了一個全新的人工智慧計算時代,甚至足以抵消摩爾定律的放緩步伐。目前 NVIDIA GPU 已經成為全球應用最廣泛的人工智慧計算平台,也是每一家企業及所有開發者在構建深度學習系統時必不可少的需要關注的方向。但諸如「如何選擇一款 GPU 來搭建深度學習平台」、「如何從頭開始配置自己的 GPU 伺服器」之類的問題一直困擾著開發者。
深度學習是一類對計算資源有著高度要求的領域,而 GPU 的選擇和配置將從根本上決定你的深度學習體驗。
如果沒有合適的 GPU,你可能需要等上幾個月才能拿到實驗結果,或者在單一實驗步驟上耗費整整一天乃至更久,甚至有可能在苦等許久之後只得到「所選參數關閉」以及模型分歧等錯誤。
有了良好且可靠的 GPU,我們將能夠對深層網路的設計方案與參數進行快速迭代,且能夠將原本長達數月或者數天的處理過程壓縮至數小時甚至數分鐘。
前些日子,AI 前線發布了文章《GPU 太貴無從下手?大神教你省錢又省心》,就如何選擇最適合自己實際需求的 GPU 給出了一些建議。可是終於選好了 GPU,還有一個更大的難題橫在眼前:又多又複雜的硬體系統參數、天書一般的英文文檔、各種不同的軟體 SDK,到底應該如何從頭開始配置好一台適用於深度學習的 GPU 伺服器呢?
配置 GPU 伺服器到底有多難?知乎上與 GPU 配置相關的提問超過 6 千條,僅「如何配置一台適用於深度學習的工作站?」這一個問題下面就有 4000+ 用戶關注,被瀏覽 68 萬餘次——難度和關注度可見一斑。
莫慌!本周 AI 前線聯合 NVIDIA 深度學習學院為大家帶來了一次免費的 GPU 伺服器配置入門課程,由最權威的 NVIDIA 技術專家為你梳理從硬體平台和軟體系統的搭建到軟體系統安裝配置的全套流程,手把手教你掌握配置深度學習訓練 GPU 伺服器的技能。
課程主題
深度學習訓練 GPU 伺服器配置入門
課程形式
視頻直播
課程時間
9 月 18 日(周二)20:00-21:00
課程介紹
本課程適合每一位有 GPU 平台程序開發需求的技術人員。在這門課中,你將學習如何從頭開始配置一台GPU AI 伺服器,我們會結合硬體系統和軟體系統介紹完整的解決方案。內容包括:
硬體平台和軟體系統的搭建
GPU 的性能特點
當前已經成熟的解決方案
軟體系統的安裝配置
CUDA, cuDNN 以及其他 NVIDIA 深度學習 SDK 的介紹
學完上述內容,你將可以自己根據不同的需求,配置一台包含軟體和硬體的成熟系統。
課程時間


※中心化or去中心化?聊聊交易所的辯證發展
※ESearch:58集團基於C+語言自主研發的搜索內核
TAG:InfoQ |