當前位置:
首頁 > 科技 > 中國神威超算性能卓越,碾壓美國日本歐洲超算

中國神威超算性能卓越,碾壓美國日本歐洲超算

上世紀60年代,中國的航天科技人員為第一顆人造衛星早日上天而日夜奮戰時,一個重要的任務是計算衛星在太空中運行的軌道。當時所能使用的還是功能和效率都十分落後、需要手工操作的半自動手搖式計算機,計算員們24小時不間斷地、像工廠里的工人一樣實行三班倒,才終於算出了東方紅一號的軌道數據,計算任務實在緊迫時,甚至動用了算盤。

而如今面對航天任務中龐大的計算量,航天科技工作者們不再發愁,因為他們已經可以動用全世界運算速度最快的超級計算機——神威·太湖之光。

中國神威超算性能卓越,碾壓美國日本歐洲超算

(一)沒有超級計算機,航天工作的計算量足夠全國人民算兩三個月

如今的航天任務,在計算量上可是比東方紅一號那會兒增加了不止一點半點,比如去年天宮一號功能失效,軌道開始下降時,需要提前了解它進入大氣層之後的受力情況,以預測是否可能在墜落時對地面造成傷害。要在有限的時間裡完成計算任務,需要一台每秒能進行億億次(10000000000000000次)加減乘除運算的超級計算機。

倘若我們的計算技術還停留在手工計算的那個年代,這將是一個不可能完成的任務,即便動員全國人民一起幫航天部門搞計算,每人每秒完成一次運算,計算任務要求在1秒內完成的運算量,也足夠全國人民算上兩三個月。

中國神威超算性能卓越,碾壓美國日本歐洲超算

(由神威·太湖之光計算的天宮1號再入大氣層時與大氣相互作用的情況)

(二)沒有中國芯,中國超級計算機再強也將受制於人

在超級計算機界,每隔一段時間就要篩選出全世界計算能力最強的500台超級計算機,發布到一個被稱為TOP500的排行榜中。排行的依據和測試手機時使用跑分軟體的方法類似:參與測試的系統要運行一個被稱作LINPACK的軟體包,求解一個規模巨大的線性方程,來測試這個系統在每秒鐘之內到底能完成多少個加減乘除的浮點運算。

在2001年前,TOP500中沒有一台中國超算,而僅僅9年之後,部署在天津的天河1號A超級計算機以每秒0.2566億億次/秒的實測浮點運算能力奪得TOP500第一的寶座。2013年,部署在廣州的天河2號以3.386億億次/秒的實測浮點性能,讓中國超算重回TOP500第一的位置。

天河1A和天河2號雖然性能強大,但其使用的核心部件CPU及數學加速卡卻是採購自美國公司。2015年4月,當天河2號準備採購新一批CPU和加速卡對系統進行升級時,美國商務部卻拒絕了Intel公司的出口申請,同時還將天津、廣州、長沙三個中國國家超算中心和國防科技大學列入了禁運機構的名單。事實上,中國超算的迅猛發展讓美國人倍感壓力。

中國神威超算性能卓越,碾壓美國日本歐洲超算

(美國商務部禁止向中國四個單位出口高性能計算原件的文件摘錄)

然而,美國人的禁運並沒有擋住中國超算繼續發展的腳步。在2016年7月的TOP500大會上,由中國國家並行計算機工程技術研究中心研製、中國國家超級計算無錫中心運行的神威·太湖之光超級計算機以理論浮點性能12.5億億次每秒、實測浮點性能9.3億億次每秒的成績登頂TOP500榜首。

有趣的是,本次TOP500第一的競爭是一場「中國德比」,被擠下冠軍寶座的是中國的天河二號。從性能參數上看,神威·太湖之光的運算速度是天河二號的三倍左右,同時運算效率比天河二號更高、功耗比天河二號更小。最重要的是,神威·太湖之光使用的是完全由中國自行設計、製造的申威26010處理器。中國超算的發展從此不再受制於人。

中國神威超算性能卓越,碾壓美國日本歐洲超算

(外型土氣、功能強大的申威26010處理器)

(三)申威26010處理器是如何工作的?

申威26010處理器採用了異構計算這個當下超級計算領域的前沿技術,通過並不十分高的頻率和功耗實現了強悍的運算能力。

1、採用異構計算提高超算運算性能

與同構計算只使用一種處理器不同,申威處理器採取了異構計算的新模式。異構計算是一種並行和分散式計算,在運算中,異構計算既使用處理器,又使用GPU或眾核晶元等協處理器。這既提高了工作效率,還能更緊湊地使用空間。

2、眾核處理器解決「通信牆」和「存儲器牆」問題

在以往使用異構計算的超級計算機中,通用CPU與個人電腦中的CPU基本相同,它除了要承擔運算任務外,還要承擔計算機系統的控制任務。而協處理器專門進行數學運算。

隨著摩爾定律逐步接近極限,提高通用CPU的性能變得越來越困難,超級計算機需要協處理器來提高自己的運算性能。然而在這種通用CPU+協處理器的組合中,協處理器都要安裝在PCI-E匯流排上,訪問計算機主內存的帶寬較低,限制了協處理器性能的發揮。

而申威26010處理器則將運算控制核心和專門進行數學運算的核心融合到了同一塊晶元中。一塊申威CPU由4個運算核組構成,每個運算核組中有一個運算控制核心和64個數學運算核心。這樣,一塊CPU中就有了4個運算控制核心和256個數學運算核心。它們可以在一片CPU內高效協同工作,也可以直接訪問內存,而不用通過擁塞的PCI-E匯流排來回倒騰數據。用專業術語來說,就是解決了眾核處理器「通信牆」和「存儲器牆」的問題。

如果單看運行頻率,1.45GHz的申威20160看起來像是已經過時的產品,但由於有著高達260個核心,單片CPU在1秒內能夠實際完成的浮點運算量為3萬億次。而天河2號使用、被美國禁運的Inter Xeon E5 2692處理器和Intel Phi加速器,1秒內能完成的浮點運算量僅為0.21萬億次和1.003萬億次,遠不及申威26010。

中國神威超算性能卓越,碾壓美國日本歐洲超算

(神威·太湖之光的運算節點板)

3、40960塊CPU層層堆疊,造超級計算機就像搭積木

從一片申威26010到整台神威·太湖之光的過程,有點像搭積木。

每個運算節點板安裝了2塊申威26010處理器,4個運算節點板組成一個運算插線板,這個插線板的外觀看起來就像是商用的刀片伺服器。32個計算插線板組成一個計算超節點。而我們在新聞中看到神威超算時常見的那些大柜子,是超算的計算機艙,總共部署了40個,每個機艙里安裝有4個超節點。

在這樣層層的堆疊下,申威·太湖之光共有40960塊CPU。神威·太湖之光12.5億億次的理論浮點性能,就來自於這40960塊CPU的浮點運算能力的疊加,即3萬億次×40960≈12.5億億次。

中國神威超算性能卓越,碾壓美國日本歐洲超算

(超神威·太湖之光的超節點)

4、要擁有性能強大的超算,互聯網路、散熱一個都不能少

看起來,解決了CPU的問題後,設計、製造一台超算好像並不是一件複雜的事情,似乎只要有足夠多經費買來足夠多的機器,再拉上網線,就可以開心的去拿世界第一了。然而事情遠遠沒有這麼簡單。

首先,這40960塊CPU所在的運算節點,每個都相當於一台獨立的計算機,當它們一起工作時,需要不斷的傳輸、交換交換數據,來共同完成運算任務。

如果用我們日常使用的百兆或千兆乙太網,數據傳輸的速度將成為計算進行的瓶頸,也許CPU花1秒完成計算任務後,要花10秒鐘的時間等待數據交換。因此,部署一台超級計算機時,首先要研發出高帶寬、低延遲的互聯網路。神威使用的節點間網路,雙向帶寬可達16GB/s(注意是GB/S而不是Gbps),如果使用這樣的帶寬來傳輸電影,1秒鐘就可以將一部高清電影傳輸完畢。

此外,超算的電子元件在工作時有很大的發熱。在機器密集的超算機櫃中,必須採取有效的方式將熱量及時帶走,才能保證超算連續穩定工作。

中國神威超算性能卓越,碾壓美國日本歐洲超算

(神威·太湖之光在空間上的布置。兩側為運算機艙,中間為網路交換系統。)

神威使用的全機水冷技術,不但比傳統能更有效的帶走熱量,還能減少用於散熱系統的電能消耗。同時,超算這個龐大的系統在 運行時,需要同時調度大量用戶不同資源需求的作業,也需要及時發現、處理系統中存在故障的節點,保持整個系統的持續運行。為此,神威還配套研發了相應的維護診斷系統和任務調度系統。

(四)超級計算機的應用與生活息息相關

中國神威超算性能卓越,碾壓美國日本歐洲超算

(近日發行的《科技創新》紀念郵票,其中一張就是神威·太湖之光超級計算機)

在神威·太湖之光榮登超級計算機TOP500榜首,證實了其硬體實力後。通過神威·太湖之光運行實現的「千萬核可擴展全球大氣非靜力方程全隱式求解器」斬獲高性能計算界的最高榮譽「戈登·貝爾」獎。這個名字冗長的應用,功能其實與我們的生活息息相關。通過這方面應用的研究,我們可以在時間和空間上更加精確地預報天氣。在未來,我們甚至可以通過這個應用的計算結果,精準的得到「我的寫字樓在下班的時候雨有多大」這類問題的答案,而不用像目前一樣靠氣象台有些模糊的天氣預報進行猜測。

在這個應用獲獎的同時,還有「高解析度海浪模式」、」鈦合金結構演化相場模擬「獲得了戈登·貝爾獎的提名。

高解析度海浪模式可以實現全球範圍內1公里解析度的海浪模擬,提升中國應對極端氣候和自然災害的減災防災能力。中國海軍的艦艇在全球範圍內航行時,都可以通過這個模式的數據提前獲知目標海域的情況。」鈦合金結構演化相場模擬「,則可以在幾小時的時間內完成一次數千億體系的合金微結構粗話過程的高精度模擬,為設計新材料提供支持。

除了以上者幾項應用外,神威超強的運算能力還有許許多多用武之處。它可以幫助中國的科學家們更好的設計研發可控核聚變反應堆,為今後能用上清潔的核聚變能源提供支持;它可以幫助新藥物的設計者在幾分鐘的時間內完成對數百萬個化合物分子的篩選,從而讓我們更好更快的設計出新藥物;它可以幫助風電場的調度人員更好的調控風資源的使用,為清潔能源貢獻力量;它還有望在高鐵、大飛機的氣動外形設計中發揮作用,讓這些交通工具跑的更快,耗能更少……

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 鐵流 的精彩文章:

中國企業開啟10nm矽片超高密度凸塊的加工技術認證,台積電慌了?
中國製造價值4.2億元魚缸 一次養魚150萬條 吃貨再也不愁啦
紅箭10導彈性能優越,可對空擊落戰機,對地擊毀坦克
中國直19頂個球,電子戰能力超越美國長弓阿帕奇
中資收購萊迪思 特朗普:否決!危害美國國家安全

TAG:鐵流 |