南京大學為什麼要建那麼大一個HPC集群?
作者 | 於澤 (大數網副主編)
深入到實際案例中,發現攻下每一個客戶都不容易。只有不斷地重複這種不易,才能使你變得偉大。
6月30日,2017聯想全球超算峰會(2017 Lenovo HPC Summit)即將召開。而在此之前的6月27日,一場小規模的研討會率先在南京上演。主角是誰?南京大學和聯想。
聯想集團數據中心業務教育行業總監蔡斯揚致辭
看起來這可能只是聯想高性能計算(High Performance Computing,HPC)在教育行業的一個具體案例,但折射的其實有很多。比如,南京大學為什麼有代表性,教育行業在HPC領域的應用情況如何,為什麼南京大學最終選擇了聯想、被其哪些方面打動等。
南京大學-HPC高教範本
一個一個來,由小到大,先說南京大學這個案例。
大背景是南京大學理工科非常強,八個國家一級學科,中國語言文學、數學、物理學、化學、天文學、地質學、生物學、計算機科學與技術學中,有七個都需要大量的運算。有了這個前提,不難理解為什麼南京大學的HPC歷程可以追溯到那麼早。
2001年,南京大學開始投資建設高性能計算中心,這也是中國最早一批高性能計算中心,後歷經2005年、2007年先後立項擴建;2009年,新建高性能計算中心,並在當年的中國高性能計算機性能TOP100排行榜列第七位,高校系統第一位。2015年,南京大學高性能計算中心的擴建再次提上日程。
截止當前,南京大學高性能計算中心改造升級項目已經結束,並正式投入運營。
南京大學高性能計算中心一角
看兩組數據,一是Linpack峰值(理論計算速度),它直接反映的是系統的性能,升級前的南京大學高性能計算集群(以下簡稱「一期」)Linpack峰值為每秒34萬億次,升級後的(以下簡稱「二期」)是844.8萬億次,是一期的近25倍。
二是系統規模,一期共402個計算節點,每節點12GB內存、2顆至強處理器,存儲是128TBSAN加上54TB並行存儲;二期呢?880個計算節點,每節點2顆至強處理器,內存有兩種規格64GB和128GB,存儲是2PB的SAN加上超過1.2PB的並行存儲。
結合兩組數據能發現很多東西,比如二期規模看起來似乎只比一期翻了一倍,但性能卻差近25倍,可見八年間信息技術發展之迅猛。
與此同時,南京大學對高性能計算資源的需求增長之快可見一斑。南京大學高性能計算中心副主任董錦明在接受採訪時表示,擴建後高性能計算中心的負載率目前在1/3左右,但他們預計一年後,就會達到80%。這並非盲目的樂觀,他解釋說,之前由於資源不足,很多老師都在外尋找計算資源,同時他們也拒掉了很多兄弟院校,以及企業的申請,把這些都算上,很快就會再次進入資源相對緊張的狀態。
這是南京大學HPC方面的一些情況,從根本上說,他們升級是因為資源不夠用了。而這很有代表性,足以體現行業趨勢,那就是高校對HPC需求量大,而且越來越大。
廣深交織-需求日益增加
為什麼高校會有如此大的需求量?從更高的層面看,一、當下是數據社會,數據量正越來越大、再加上人們對數據分析效率的追求越來越高,這需要更為強大的計算力,二是信息技術這些年取得長足進步,使得HPC的獲取變得簡單、容易,之前需要大量的人員、資源投入,現在以極少的代價就能享受其強大的能力。
聚焦高教,就如南京大學的情況,需要藉助HPC的學科越來越多,越來越深。舉個例子,車輛設計需要HPC,但很多基礎的研究並不在汽車製造公司,比如材料、分子等。在哪?在高校、在研究所。車輛設計只是HPC應用的一個門類,但高校覆蓋的是各個學科,物理、化學、生物……連接的是各行各業,因此可能高校HPC在某一領域的應用深度比不上產業,但廣度絕對超過所有單一行業。
這是其一,高校科研涉及領域廣泛,需要HPC的地方多。其二,隨著研究的不斷深入,追趕國際領先水平腳步的日益加快,高校在單一領域對HPC的需求量也會與日俱增。
這可以理解為當前高教領域對HPC需求的現狀,需求量大、重視程度日益增加,這一點從南京大學身上也能看出。
除此之外,事實上,從另一個側面也看出這一點,那就是建設高性能計算中心的院校越來越多,這幾年僅聯想實施的就有北京大學超算中心、廈門大學化學化工學院超算中心、青海大學水利工程超算中心和南方科技大學新能源超算中心等十數個,HPC在高教行業的發展速度可以想像。
聯想HPC-它們的一致選擇
為什麼這麼多院校會選擇聯想作為合作夥伴,聯想打動他們的是什麼?南京大學的案例或許能解釋其中的緣由。
南京大學高性能計算中心副主任周慶林教授
南京大學高性能計算中心副主任周慶林教授在採訪中談到了兩點:一、先入為主,南京大學高性能計算中心上一套系統是IBM的,用的很好,穩定、可靠,而聯想收購了IBM x86伺服器業務,沒理由不繼續使用。
二、聯想的實力,尤其是在高性能計算領域的實力。連續多年國內HPC TOP100排行榜榜首,連續多屆國際HPC TOP500第二,不用再細說技術能力、服務能力,這些成績已經說明了一切。
除此之外,他還講了一個小插曲,一個國際知名廠商已經買了標書了,最後投標卻沒來。他猜想可能還是滿足不了南京大學的需求,可能是技術能力不足,也可能是實施能力不夠。
實際上,就如周慶林所分析的,技術實力跟聯想差不多的,服務能力未必跟得上;服務能力夠的,技術能力又不一定行。最終多方權衡,聯想是最好的選擇。
當然,他們的選擇絕對是對的,聯想絕對有能力擔負起大家的期待。作為中國最早做HPC的廠商,聯想有足夠的積澱,並且在收購IBM x86伺服器業務後,這些能力獲得進一步增強。
看看聯想在HPC領域的布局,深騰X8800解決方案、水冷技術、LiCO智能超算平台……再加上全球化的專業團隊,覆蓋應用調研、方案設計、方案論證、應用測試和優化、現場安裝和實施端到端,以及開放心態下緊密無間的合作夥伴,其有今天的成績一點都不意外。
面向未來,聯想還在不斷的進步,更好支持AI(人工智慧)的LiCO平台、很快就要發布的Think System伺服器產品線、團隊進一步的調整細化。據說30號還會有重大發布……一切為了客戶,明天自然不會差。
採訪手記
沒人能隨隨便便成功,4500萬大項目的背後,是雙方無數次的溝通交流、是很多人沒日沒夜的加班加點。就如聯想集團蘇皖大區DCG業務總監郝飛所透露,服務這個項目的一個20人的團隊最忙的時候,十天時間平均每個人只睡一天。對此,周慶林他們笑笑說,我們真沒少提要求。
再想想聯想做了那麼多這樣的項目,於是我寫下了開篇的第一句話。


※網易雲整合通信和視頻產品線,不止盯著秀場直播
※浪潮雲≠政務雲
TAG:大數 |
※園區將大變,要建這麼多大項目!
※中國要建一個大型香菇綜合市場,應該建在哪個地方?
※錦州這個「大劇院」就要建成了!一看就感覺高大上
※Etsy要建多倫多人工智慧中心?
※你住哪個區?今年無錫要建這麼多大項目!
※要建設一個什麼樣的首都?北京這樣說
※趣聞兩則:1.汽車當滑鼠;2.HBO要建一個真正的西部世界小鎮
※好消息:馬來西亞要建直通新加坡的第三座大橋
※美國東南部海島城市,為什麼要建國?
※大連要建多個專業足球場!
※這艘船比航母還要大,俄羅斯剛說要建,中國就送去一份大禮
※俄羅斯是能源大國,為什麼還要建核電站?
※好端端的民俗村,卻要建「亞洲第一大佛」,結果成了十大爛尾工程
※為什麼要建立社群?
※為何新的AIM-260導彈需要建立一個秘密基地?
※要火!大武漢將要建一座警察博物館
※有錢任性,NVIDIA又要建新總部了:面積增大50%
※韓國要建「隱身」大樓稱碾壓迪拜,建成就是世界第一大樓!
※馬斯克在澳洲建了全球最大蓄電池 英國億萬富豪要建個更大的
※為什麼日本這個小小島國,地少人多,卻還要建那麼多的小洋樓?