為什麼天文學的最大問題是數據太多?
太空
今年早些時候,天文學家偶然有了一個意外的發現:我們的銀河系中心附近可能存在著數千個黑洞。導致這一發現的X射線圖像並不是來自於一些最先進的新望遠鏡,甚至都不是最近的觀測數據,其中一些數據其實是20年前就已經收集到。
研究人員通過挖掘以前的、長期存檔的數據,發現了黑洞。因為大數據時代改變了科學的發展方式,像這樣的發現只會變得越來越普遍。天文學家每天都在收集呈指數增長的海量數據,以至於需要數年時間才能發現埋藏在存檔中的所有隱藏信息。
天文學的發展
60年前,典型的天文學家基本上是獨自工作,或者是在一個小團隊中工作。他們可能在所在院校中能使用一個相當好的大型地面光學望遠鏡,這些觀察大多局限於可見光的波長。這意味著他們錯過了來自大量天體物理源的信號,這些物質可以發射出非可見的電磁波,從低頻無線電波一直到高能伽馬射線。
如今,有一些天文台覆蓋了整個電磁波譜。這些最先進的天文台不再由單個機構運作,通常由宇航局發射,有許多國家共同參與的。
哈勃太空望遠鏡
這些天文台產生了驚人數量的數據。例如,哈勃太空望遠鏡自1990年開始運行,已經完成了130多萬次觀測,每周傳輸大約20 GB的原始數據。要知道,這台望遠鏡是在20世紀70年代設計出來的,如今還在正常工作。位於智利的阿塔卡瑪大型毫米陣列現在預計每天會增加2 TB(2048 GB)的觀測數據。
海量數據
天文數據的存檔已經非常龐大了。每一代天文台的靈敏度通常至少是以前的10倍,要麼是因為技術進步,要麼是因為尺寸更大。例如,同為運行10年的伽馬射線望遠鏡——高能伽馬射線實驗望遠鏡和費米伽馬射線太空望遠鏡,前者在1991年投入使用,在10年里發現了大約190個伽馬射線源;後者在2008年投入使用,目前已經觀測到超過5000個伽馬射線源。
大口徑全景巡天望遠鏡
目前正在智利建造的大口徑全景巡天望遠鏡是一種光學望遠鏡,每隔幾個晚上,就能繪製整個天空的圖像。它的靈敏度極高,每晚將會發現1000萬個新的信號源,10年後會產生超過15 PB(1 PB=1024 TB)的數據。
此外,平方公里陣列射電望遠鏡在2020年完工後,將成為世界上最靈敏的望遠鏡,它能夠探測到50光年遠的外星文明的航空雷達站發出的信號,如果那裡存在外星文明的話。僅僅一年的觀測,該望遠鏡將產生比整個互聯網更多的數據。
宇宙深處
這些雄心勃勃的項目將考驗科學家處理數據的能力。圖像需要進行自動處理,這意味著數據需要被簡化為可處理的大小,或者轉換成最終結果。新的天文台正在突破計算能力的極限,要求設備每天能夠處理數百TB位元組。
解鎖新科學
海量的新數據將使天文學成為比以往任何時候都更加需要合作和開放的科學。多虧了互聯網檔案,強大的學習社區和新的拓展計劃,普通人現在可以參與天文學研究。例如,通過計算機程序Einstein@Home,任何人都可以利用他們計算機的空閑時間來幫助尋找來自黑洞碰撞的引力波。
Einstein@Home
對科學家來說,這也是一個激動人心的時刻。因為研究物理現象時間尺度太寬廣了,遠遠超過了正常人類生命長度,實時觀察它們是不可能的。像星系合併這樣的事件,可能需要數億年的時間。我們所能捕捉到的只是一張快照,無法看到它們的全過程。
然而,也有一些現象發生在更短的時間尺度上,只需幾十年、幾年甚至幾秒鐘。這就是科學家在新研究中發現成千上萬個黑洞的方式,他們意識到,自從20世紀90年代首次探測到以來,來自附近矮星系中心的X射線輻射正在消失。這些新發現表明,在跨越幾十年的檔案數據中,將會發現更多的信息。也可以說,天文學在目前以及未來要面臨的最大問題是海量的數據。


TAG:火星一號 |