當前位置:
首頁 > 最新 > 超級計算機到底能幹啥

超級計算機到底能幹啥

除了呼呼的風扇聲,賽場一片沉寂,在場的上百名大學生緊盯著電腦,手指飛快地敲擊鍵盤。

這群平均年齡不到22歲的大學生,面對的是當下最前沿的研究:機器閱讀理解、獲2017年諾貝爾化學獎的冷凍電鏡技術、美國國家航空航天局(NASA)的流體力學模擬軟體……

面對海量的數據,清華大學的大四學生李北辰估算後決定調整方案,「幾乎沒法跑完」。臨到結束,他甚至能聽到自己的心臟「咚咚」地跳動。

這是2018年世界大學生超級計算機競賽(簡稱ASC18)的現場,在2天20小時的規定時間裡,每個隊伍需要自己搭建小型超級計算機,完成組委會布置的4道題目,運算的結果將作為最後成績的評分依據。

李北辰隊伍搭建的機器的運算能力,約為1萬台現在市面上主流家用電腦運算能力之和,但相比目前世界上最快的超級計算機「神威·太湖之光」,他們的算力還不到百分之一。

在幾個國家超級計算中心的超級計算機里,日夜運行著全國各地發來的運算指令。不管是天文觀測、航空模擬計算,還是天氣預報、生物醫療等日常生活的需求,都需要超級計算機的支撐。

「超級計算機的研究水平決定了一個國家的尖端科研實力。以天氣預報為例,如果計算明天天氣的時間超過一天,那這個預報就毫無意義了。」國家超級計算濟南中心主任張雲泉告訴中國青年報·中青在線記者。目前中、美、日、俄等國對高性能超級計算機研究大力投入的背後,也是搶佔科研製高點的競賽。

1後面17個0

這是一個以萬億為計量單位的世界。

在超級計算機領域,有著一份世界500強榜單。根據最新的排名,如果一台機器的運算能力達不到500萬億次每秒,它將被無情地「除名」。衡量超級計算機的標準「簡單粗暴」:運算能力夠快。上一代超級計算機使用的架構與目前主流的不同,現在的技術將來也可能被量子計算機取代。

這份榜單每隔半年更新一次,總是能引起全世界的關注,人們津津樂道冠軍的更替,哪個國家上榜的超級計算機最多、總算力最高還被美國總統寫進國情咨文。

2013年至今,中國自主研發的超級計算機就一直穩坐榜首。最近兩年,這個位置屬於「神威·太湖之光」,它的峰值運算速度達到每秒12.5億億次,「1」後面17個「0」,大致相當於200萬台普通電腦同時運行。

但它遠不止是堆積用於運算的中央處理器(CPU)和圖形處理器(GPU)這麼簡單。張雲泉告訴記者,超級計算機的運算速度不遵循「1+1=2」的公式,還得考慮它們之間工作分配、數據傳輸的損耗。「這就像領導10個人和領導1000個人的區別,如果不能合理管理,每個人的工作效率都會大大降低,即每個CPU和GPU的性能都沒有得到充分運用。」

在國家超級計算濟南中心,「神威·藍光」超級計算機黑色的機箱緊密排布,圍成一個大圈,被小心安放在數百平方米的一樓大廳內。當這台研發費用數億元的機器運轉時,功耗是1兆瓦,大致相當於1.5萬戶家庭的家電功率總和,每年僅電費一項支出就接近2000萬元人民幣。

相比國家超級計算中心的「大手筆」,李北辰參加的ACS18則要求機器總功耗在3000瓦以內,這意味著能使用的CPU、GPU數量有一個上限。

為了最大化利用它們的運算能力,他們必須精打細算,一方面仔細分配每個節點的運算內容,另一方面還要簡化複雜的運算,讓每個節點能同時計算儘可能多的內容。

在這次比賽中,他們隊伍用了16塊GPU,總價值超過60萬元人民幣。為了分攤風險,幾位隊員一人負責幾塊,小心翼翼地將這些寶貝從學校的實驗室運到比賽現場。賽前,場地上趴滿了選手,大家都在緊張地安裝和調試設備。

租用超算一天,花費上萬元

比賽開始不多久,參賽的選手就開始冒汗。除了心理因素,還因為現場設備高速運轉時,會釋放大量的熱量,隊員戲稱「可以攤雞蛋了」。每個GPU都必須配備降溫風扇,否則就會因溫度過高而停止運行。

對超級計算機來說,如何有效地帶走這些「大腦」思考時散發的熱量一度是發展瓶頸。在國家超級計算廣州中心,工程師專門建造了冷水廠,不間斷運送8攝氏度的水進入「天河二號」的水冷系統。

機房還安排人員24小時值班,監控機器的運轉狀況,清理垃圾進程,實現效率的最大化。「是機器就有損壞和出問題的概率,怎樣讓它們的影響儘可能小也是門學問。」張雲泉說。

李北辰曾參加另一場大學生超算競賽,48小時不間斷地比賽,他和隊員只能輪流睡覺,保證有人時刻盯著機器運行。此外,組委會還隨機對賽場斷電,考查程序及時備份的能力。在實際使用中,這些都是極可能出現的挑戰。

中山大學腫瘤防治中心的博士後趙齊對此深有體會,他所在的團隊是最早用「天河二號」測試生物應用的團隊之一。因為需要處理大量的生物基因組數據,他們從2012年起就開始使用超級計算機。

他告訴中國青年報·中青在線記者,他曾遇到各種奇怪的報錯和任務丟失,環境配置也不定時出問題,經常算出他自己都不敢相信的結果。

這是因為生物信息領域在超級計算機上的應用還在起步階段,成熟的軟體不多,很多時候需要用戶和超算中心的工作人員合作開發解決問題。

在過去5年,光他一個人就用「天河二號」處理了超過100TB的數據。超級計算機能在幾天或幾小時里,處理一般計算機半年乃至幾年才能處理完的工作。以前,等待運算結果是他最苦悶的時候,「用上超級計算機算是奔小康了。」

因為需要處理的數據太多,網路傳輸較慢,趙齊有時會採用郵寄硬碟的方式,「郵遞員最快」。

只是這樣的代價很高。趙齊所在的實驗室每年消耗在數據存儲上的錢就在5萬元左右。租用超級計算機進行數據處理,有時一天就會花費上萬元。

對多數用戶來說,使用超級計算機和自己的電腦沒什麼區別,登錄賬號,上傳數據就行了,運算遠在千里之外進行。

超算世界500強前兩名是中國

當你拿起智能手機,向語音助手詢問天氣,遠在美國的超級計算機在不到1秒的時間裡理解了你的意思。甜美的女聲播報的結果,則由濟南、廣州、無錫等多地的超級計算機共同計算得出。

大量影視公司利用它進行後期特效處理,傳統製造業也倚仗這個技術,部分公司洗衣液的瓶子都是超級計算機設計的。

有了超級計算機,研究者可以模擬出人類器官對藥物的反應,大大縮短新葯的研發時間,節省成本。在抗埃博拉病毒藥物的篩選中,超級計算機能夠在一天內完成超過4000萬分子化合物的篩選,以最快的速度應對爆發性惡性傳染病。

此外,使用超級計算機進行核爆炸模擬還是美國研究核武器的方式。

過去,超級計算機的主要任務是進行科學計算。最近幾年,有關人工智慧的運算請求也越來越多。

為此,ASC競賽也開始引入人工智慧的問題,李北辰打比方說,過去他們的工作類似於計算式子的結果,但現在,他們更像是在做應用題,要先讀懂問題,從中抽象出式子,再進行計算。

目前,「天河二號」的用戶已經超過1200家,包括各大高校、研究所,支撐國家級課題超過400項。

2001年時,超級計算機500強名單中沒有一台來自中國。而現在,榜單前兩名都被中國佔據。此外,中國的上榜數量達到204,排名第二的美國只有143。

2015年,美國開始對中國超級計算機領域施行晶元禁運,在那以前,美國對中國出口超級計算機也有諸多限制,例如出售的機器性能不能高於中國自己所能研發的機器性能。

張雲泉告訴記者,我國已經掌握超級計算機的製造技術,包括「神威·太湖之光」「神威·藍光」的一系列設備,從晶元、操作系統到冷卻系統都完全由我國自主研發。

雖然中國在硬體條件上取得領先地位,但軟體方面仍需要大量的投入。目前應用於超級計算機的商用軟體幾乎全部由美國、日本等國開發,中國的市場佔有率基本為零。

「應用於超算的生物信息學軟體開發起來舉步維艱。」趙齊感慨,「人才缺口很大。」他所在的專業,很多人都放棄使用「天河二號」,因為學習和溝通成本太高。他覺得,超算中心應該做更多對超算技術的科普和培訓。

在計算機科學領域,超級計算機不是熱門方向。李北辰的同學中,每年只有10%左右的同學對這個方向有興趣,多數人還是投身人工智慧的研究。

在張雲泉看來,解決軟體問題需要政策和財政兩方面的支持。「西方國家在超算領域多是制訂10~20年的計劃,背後有點軍備競賽的意思。但中國一直是制訂5年計劃,完成後再討論下一個5年要不要繼續。這樣規劃不夠長遠,技術團隊也難以保持穩定。」

他介紹,我國對超級計算機領域研究的總投入與美國接近,但對軟體的投入偏低,目前僅佔總投入的20%。他認為,這個比例應該到50%比較合適,美國、日本也是這個比例。

「美國對超級計算機的研究已經超過了50年,而我國才剛剛30年,我們需要多一些耐心。」張雲泉說,「過去我們是跟在別人後面跑,就只顧得上追了。現在我們超前了,該看清前進的方向,這比追趕花功夫得多。」

------------------

原標題:《超級計算機到底能幹啥》

原文刊載於《中國青年報》( 2018年05月16日 11版)

- END -

作者簡介

王嘉興

畢業於清華大學物理系

可能是記者里最懂物理的人之一

歡迎留言,跟作者溝通互動

另外,從今天開始

我們決定開放微信公號轉載許可權

不再要求付費轉載

需要開通白名單的賬號

後台回復「轉載」了解詳情哦

微信值班編輯:溫維娜

審核:張國

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 中國青年報 的精彩文章:

含冤27年 吉林劉忠林故意殺人案終改判無罪
細雨中送別霍金!網友:我知道,他是去了星辰宇宙

TAG:中國青年報 |