當前位置:
首頁 > 軍情 > 中美超算將進入交替領先時代

中美超算將進入交替領先時代

【文/ 科工力量專欄作者 鐵流】

日前,美國能源部田納西州橡樹嶺國家實驗室的工程師推出了一台名為 Summit 的超級計算機,這款超算的計算能力已經超過了中國神威·太湖之光超級計算機,比神威·太湖之光要快 60%。對於這件事,國人應該辯證的看,既要看到美國在超算方面具備非常深厚的技術積累;同時,也不要妄自菲薄,不要因中美兩國錯開了發展周期導致的交替領先而自嘆自哀。畢竟,在超算領域,中國完全可以拿出高度國產化,且性能與美國頂尖超算比肩的大機器。

對美國新超算要辯證的看

根據介紹,美國Summit 的峰值計算能力可以達到每秒 20 億億次,是美國此前的明星超級計算機Titan計算能力的 8 倍,比神威·太湖之光要快 60%。

Summit 超算性能如此強勁,主要得益於IBM的Power9、英偉達的 V100 GPU。Summit 超算搭載了9000多片Power9和大約28000片左右的V100 GPU。Power9是IBM研發的新一代CPU,擁有80億個晶體管,集成了22個CPU核。

值得一提的是,Power9還支持NVLink,由於NVLink相對於PCIE有很大的優勢,這使得IBM和英偉達的超算方案相對於英特爾的超算方案具備一定優勢。根據媒體介紹,通過NVLink,CPU和GPU之間的互聯帶寬,可以達到X86伺服器所使用的PCIE3.0的9倍。

NVLink和bluelink有點類似,可以用來鏈接加速器、存儲設備等。Power9上的bluelink是可以通用的,支持NVlink只是功能之一。只不過,由於英偉達的GPU只支持NVlink,這使得IBM的Power8和Power9等極少數的幾款CPU成為了唯一支持NVlink的晶元。

雖然有媒體把IBM的這一做法稱為「展示了IBM重返超算晶元的決心」,但實際上,NVlink也就只有英偉達自己玩。IBM可能是「順便」支持一下,畢竟IBM本質上是想支持相對開放的OpenCAPI。

這裡說明一下,既然NVlink這麼好,英特爾為啥不支持呢?

主要是因為商業競爭因素,畢竟英偉達和英特爾在HPC和機器學習市場競爭非常激烈,換作你要是英特爾的主管,你會去支持么?

其實,不止NVlink英特爾不支持,像OpenCAPI、CCIX、GEN-Z 等開放的標準英特爾都沒支持。

不過,在感嘆Power9、V100和NVLink強悍性能的同時,我們也要看到Summit 超算的創新也是有一定局限性的。

總的來說,Summit 超算的設計思路和天河2A沒有太多差別。具體來說,Summit 超算中的Power9其實就扮演著天河2A中E5的角色,而V100 GPU則發揮著天河2A中矩陣2000的作用。無外乎推出的時間遲了一點,CPU、加速器和互聯都新了一點,性能好了一點。

神威太湖之光超算上就沒有採用天河一號和天河二號上的方案,而是獨闢蹊徑,開創了片上微異構的設計。相比之下,美國Summit 超算則延續了前人探索出來的老路,相對保守一些。

另外,在性能功耗比上,有媒體用Summit 超算功耗與神威太湖之光相當,但性能比神威強60%來顯示神威超算的不足。其實,這主要是晶元製造工藝造成的,畢竟SW26010是2014年的晶元,採用相對老舊的28nm工藝。如果換成Power9、V100的先進工藝,神威超算的性能功耗比未必會比Summit 超算差。

高性能超級計算機意義重大

自天河二號在TOP500榜單上以絕對優勢佔據第一的寶座之後,各種攻擊紛至沓來。比如有媒體聲稱,把智能手機晶元連起來,可以輕易做出遠遠強於天河二號的超算;又比如因使用了美國的晶元,有媒體攻擊天河二號是「組裝貨」。在神威太湖之光實現晶元、互聯等核心技術全部國產化之後,超算無用論甚囂塵上。一些人聲稱,「因為現有的超算性能夠用,所以美國不需要比拼超算」,中國搞超算是「政績工程」、「形象工程」。

非常有意思的是,當如今美國超算重回世界第一寶座之際,超算在一些輿論口中,又一下子從「政績工程」、「形象工程」變成了高端製造業的明珠。這種精神分裂的表現著實令人啼笑皆非。

必須聲明的是,超算無用論和「政績工程」、「形象工程」的論調是站不住腳的。

其實,西方很多國家非常渴望像神威太湖之光這樣的高性能超算,因為很多應用在舊的超算上已經跑不動了。所以神威超算一問世,很多國外學者就很迫切地把自己的代碼、軟體拿過來和中國人一起研製,特別是在不涉軍涉密的科學研究上。

中國計算機學會高性能計算專業委員會秘書長張雲泉曾表示:「許多國外的朋友通過郵件找到我,說他們有個應用,希望和太湖之光聯合開展研究。還有法國大使館的科技參贊也專門找到我,希望中法之間簽訂戰略合作協議,讓法國的科學家到中國來使用太湖之光。」

美國 Summit 的超級計算機也證明了,世界各國對於超算性能的追求都是無止境的。原因在於超算的性能是永遠不夠用的,學科需求、計算的精度和規模是無止境地向前發展,我們現在超算的性能是無法滿足使用的。往往是超算應用降低精度要求、規模要求來配套現在超算的性能。

超算的重要性還體現在航天、國防、科研等諸多領域,比如國家計算流體力學實驗室基於「神威·太湖之光」超級計算機,對「天宮一號」飛行器兩艙簡化外形隕落飛行繞流狀態大規模並行模擬。國內某超算就承擔著模擬核爆、情報分析等非常關鍵的任務。

正是因此,在數年前,美國上一任總統奧巴馬就發過總統令,要求把世界第一超算的寶座搶回去。特朗普上台後,雖然砍了很多科研經費和醫療方面的錢,但他沒砍超算的錢,反而給超算增加錢。這足以說明超算的重要性和意義。

結語

目前,中國和美國都在爭分奪秒研發E級超算。中國三家單位分別在研發各自的E級超算原型機。

在上個月,相關單位公布了天河三號超算原型機。根據官方報道,天河三號將告別前代的英特爾晶元,那麼原型機里的CPU極有可能是FT2000plus,而加速器則極有可能是矩陣2000,或者是矩陣2000更換更好工藝的升級版。

天河三號原型機的單個計算節點性能為6T,必須說明的是,這個只是原型機,6T的單節點性能只是原型機的性能,並不一定是天河三號的單節點性能,因為天河三號很有可能會更換性能更好的晶元。

總的來說,中美超算競賽將會進入交替領先的狀態,我們由衷的希望神威、天河、曙光超算能夠在E級超算的競賽中取勝!


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 觀察者網軍工頻道 的精彩文章:

土耳其防長:美國擔心土部署S400探測F35數據向外傳輸

TAG:觀察者網軍工頻道 |