美國超算將重奪全球第一，性能超神威·太湖之光2倍

新聞 06-09

新智元編譯

來源：Wired、top500.org

編輯：肖琴

【新智元導讀】美國Summit超級計算機現在已經在美國橡樹嶺國家實驗室運行，峰值運算速度達到200 petaflops，超神威·太湖之光的60%。如無意外，它將在本月底公布的Top 500榜單中名列第一，讓美國重奪「世界上最強大超算」桂冠。而且，它的設計非常適應人工智慧技術，被譽為「最聰明超算」。

美國超算將重奪全球第一，性能超神威·太湖之光2倍

備受關注的美國Summit超級計算機現在已經在美國橡樹嶺國家實驗室（ORNL）運行。這台新的超級計算機被非官方地稱為「世界上最強大的計算機」。而且，它的設計部分是為了擴大人工智慧技術的應用範圍。

自2013年6月「世界最強超算」的桂冠被中國的神威·太湖之光超級計算機摘取以來，美國一直沒有擁有奪回這個稱號。Summit超算預計在本月晚些時候正式發布，屆時國際「TOP 500」組織將正式發表世界超級計算機Top 500榜單。除非中國本月爆出大驚喜，否則新的排名公布後，Summit將使美國重回超算Top 500榜單的第一名。

儘管在雲計算和大型數據中心的時代，超級計算機已經失去了一些吸引力。但許多棘手的計算問題仍需要大型的機器。美國政府去年發布的一份報告提出，美國應加大對超級計算機的投資，以便在核武器和高超音速飛機等國防項目，以及航空、石油勘探和製藥等領域的商業創新等方面趕上中國。

Summit：比普通筆記本電腦快100萬倍，比神威·太湖之光快2倍

Summit超算由IBM和NVIDIA為美國能源部的橡樹嶺國家實驗室製造，其佔地面積相當於兩個網球場大小，為了冷卻其37000個處理器，周圍的循環系統每分鐘要消耗4000加侖的水。儘管美國能源部（DOE）尚未透露Summit的Linpack測試結果，但橡樹嶺國家實驗室表示，Summit的峰值運算速度達到200 petaflops，也就是每秒浮點運算次數達到200千兆次。這比普通筆記本電腦的運算速度快100萬倍，是神威·太湖之光（93.01 PFLOPS）峰值性能的兩倍有多。

200 petaflops是什麼概念呢？如《紐約時報》所述，一個人需要花630億年的時間來完成Summit一秒鐘內可以完成的計算。而MIT技術評論說，「地球上的每個人每天每秒鐘進行一次計算，持續305天，才能完成Summit超算眨眼之間可以做完的事情。」

美國超算將重奪全球第一，性能超神威·太湖之光2倍

Summit超級計算機的4608台伺服器內部的視圖。圖：橡樹嶺國家實驗室

儘管Summit的基本規格已經公開有一段時間了，但這裡還是有必要重新介紹一下：Summit由4608個節點組成，每個節點包含兩個Power9 CPU和6個NVIDIA Tesla V100 GPU。節點與Mellanox雙軌EDR InfiniBand網路連接在一起，為每台伺服器提供200 Gbps的速度。

假設所有這些節點都配備齊全，GPU單獨將以雙精度提供峰值215 petaflops。此外，由於每個V100還提供125 teraflops的混合精度 Tensor Core 操作，系統對深度學習運算的峰值性能大約為3.3 exaflops。

exaflops級的性能也不僅僅是理論上的。根據ORNL主任Thomas Zacharia的說法，在早期的測試中，橡樹嶺國家實驗室的研究人員在一個分析人類基因組序列變化的項目中，使用Summit超算每秒進行了超過10的18次方次的計算。他們聲稱這是科學計算第一次達到這樣的計算規模。

比以往任何超算都更適合機器學習技術

美國新推出的這台最強超算不僅僅對計算力的地緣政治意義重大。它的設計比以前的超級計算機更適合運行谷歌、蘋果等科技公司流行的機器學習技術。

研究人員發現，圖形晶元可以為深度神經網路技術提供更多計算力，這也是計算機可以在聲音識別、棋盤遊戲等方面打敗人類的一個原因。Facebook最近披露，一個使用數十億張Instagram照片的人工智慧實驗，在近一個月的時間裡佔據了數百張顯卡。

Summit擁有近28000個英偉達（Nvidia）生產的圖形處理器，以及IBM生產的9000多個傳統處理器。對於超級計算機來說，使用大量的圖形晶元是不常見的，因此它應該能在部署機器學習以處理艱難的科學問題方面實現突破。橡樹嶺國家實驗室主任Thomas Zacharia說：「我們打造了世界上最強大的超級計算機，但它也是世界上最聰明的超級計算機。」

美國超算將重奪全球第一，性能超神威·太湖之光2倍

Summit的數千台伺服器佔地有兩個網球場那麼大。圖：Carlos Jones/橡樹嶺國家實驗室

當然，Summit還將支持美國能源部最感興趣的標準科學規範，特別是那些與核聚變能源、替代能源、材料科學、氣候研究、計算化學和宇宙學等相關的科學規範。但由於這是開放的科學系統，可用於所有類型的研究，可以與能源無關。Summit也將用於醫療保健的應用領域，如藥物發現、癌症研究、成癮和其他類型的疾病研究。事實上，在宣布該系統投入使用的新聞發布會上，Zacharia表示，他希望橡樹嶺國家實驗室成為「醫療數據分析領域的歐洲核子研究中心」。

「分析」與Summit的深度學習傾向非常吻合，因為前者實際上是後者的疊加。早在2014年，當美國能源部第一次簽約Summit系統時，能源部可能只對他們將得到的AI能力有一個粗略的概念。儘管IBM在將Power9-GPU平台提交給美國能源部之前一直在宣傳其以數據為中心的超級計算方法，但當時人工智慧/機器學習應用領域仍處於初級階段。由於NVIDIA決定將專用的 Tensor Cores 集成到V100中，Summit最終成為了一個AI巨獸，同時也是一個強大的HPC機器。

因此，除了高性能計算的之外，該系統還可能參與大量尖端的人工智慧研究。目前，Summit只對經選擇的項目開放。到2019年，該系統將變得更加廣泛可用，包括將用於理論與實驗創新計算項目（INCITE）。

到時，Summit的前任Titan超級計算機很可能會退役。Summit的性能約為Titan的8倍，能效提高5倍。當橡樹嶺在2012年安裝Titan時，它是當時世界上最強大的系統，也是美國最快的超級計算機（現在是第二快）。Titan也擁有NVIDIA GPU，但這些都是K20X圖形處理器，其機器學習能力僅限於每個設備四個單精度teraflops。幸運的是，為Titan開發的所有支持GPU的HPC的代碼都應該能夠輕鬆移植到Summit上，並且應該能夠充分利用V100更高的計算能力。

伊利諾伊大學厄巴納-香檳分校國家超級計算應用中心的研究員Eliu Huerta將Summit的龐大GPU池描述為「像夢境一樣」。Huerta此前曾在一台名為Blue Waters的超級計算機上使用機器學習技術，在LIGO天文台的數據中探測引力波。LIGO天文台的兩位創始人因此獲得了2017年諾貝爾物理學獎。Huerta希望Summit的成果將有助於分析預計將於2019年啟用的大型天氣觀測望遠鏡每晚接收到的約15 TB的圖像。

Summit還將被用於在化學和生物學的問題中利用深度學習技術。 Zacharia說，這項研究可能有助於能源部的一個項目，該項目使用來自2200萬退伍軍人的醫療記錄，其中包括大約25萬人的完整基因組序列。

有些人擔心美國在超大規模計算機上的競爭力，他們希望，Summit將激發對打造其繼任者的更多興趣。

Summit還將發揮另一個重要作用，即為E級科學應用提供一個發展平台。作為橡樹嶺國家實驗室的最後一個petascale系統，這台200 petascale的超算將成為未來幾年一系列HPC代碼向exascale機器轉移的墊腳石。現在，隨著Summit的完成，這似乎不再是一個遙遠的前景了。「畢竟，（E級計算）離我們現在的超算能力只差5倍，」Zacharia笑著說。

美國、中國、日本和歐盟都宣布了第一台「E級」（exascale）計算機——每秒計算能力超過千萬億次——這是大規模計算的下一個里程碑。美國信息技術與創新基金會全球創新政策副總裁Stephen Ezell說，中國宣稱將在2020年實現這一里程碑，如果Summit的繼任者Aurora按照計劃完成，美國可能會在2021年實現這一目標。但該計劃此前曾被推遲。「高性能計算對於一個國家的國家安全，經濟競爭力和應對科學挑戰的能力來說都是必不可少的，」Ezell說。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 新智元 的精彩文章:

※陳天奇團隊新研究：自動優化深度學習工作負載
※李沐：十分鐘從 PyTorch轉MXNet

TAG:新智元 |