當前位置:
首頁 > 科技 > 在NASA做數據審查是一種怎樣的體驗?

在NASA做數據審查是一種怎樣的體驗?

在NASA做數據審查是一種怎樣的體驗?



撰文|鄒小瑞(美國行星科學研究所行星學家)

我曾是中國探月工程科研團隊的一員。幾年前的某天,我偶然間看了一部「新視野」號任務的紀錄片,我激動地哭了:「世界上竟然有這麼牛的行星探測項目」。


當時,「新視野」號還沒有飛到冥王星,沒人知道冥王星居然長得那麼萌,會拿出一顆大大的「心」迎接人類航天器的首次窺探。當時的我更想不到,後來,我不僅在美國親眼見證「新視野」號飛越冥王星的偉大時刻,還親身參與了「新視野」號科學數據的評審。


探測數據為何需要審查?


讓五十年或更久以後的人拿到這份數據也能正常使用

參與評審的過程給我留下了很深的印象,因為這無疑是我參加過的不計其數的評審會中最淋漓盡致的一場。「新視野」號飛越冥王星階段獲得的幾千張照片,一大堆事無巨細的文件頭、文件標籤、數據說明文檔,我抱著電腦「花痴」了整整一個星期,把照片拿來跑代碼、各種折騰,想盡一切辦法在雞蛋裡面挑骨頭。這些數據由萬眾矚目的「新視野」號團隊出品,毛病當然也不是輕輕鬆鬆就能挑得出的。因此,這是一份責任重大、幸福無比、又很有挑戰的工作。


為什麼「新視野」號飛越冥王星的探測數據,需要一堆科學家來審查呢?其實不止「新視野」號的數據,而是所有NASA參與的行星探測任務的科學數據都要經過審查程序。這些數據最終會通過NASA的行星數據系統(PDS,Planetary Data System)發布給全世界,發布前都必須經過嚴格的評審程序,邀請業內同行專家全面審查數據的可用性、格式是否正確、說明文檔是否清晰。


地球上的任何人都能通過網路直接下載獲得通過評審的數據。你沒有看錯,真的是任何人都可以。如果你特別喜歡那個捧著一顆大心的星球,可以等著圍觀飛越數據的發布。也許,等我閑下來了,還可以再教教大家怎麼「玩轉」冥王星數據……(我是不是給自己又挖了一個新坑?!)


NASA行星探測數據審查的核心思想是「讓50年或更久以後的人拿到這些數據也能正常使用」。投入了大量財力、智力和時間獲得的科學探測數據非常珍貴,不僅僅在科學圈有學術貢獻,還要分享給全社會,並且把所有科學數據嚴謹、認真、完好地保存下去。


「讓五十年或更久以後的人拿到這份數據也能正常使用」。這句話的意思是,當參與太空項目和數據處理的科學家、工程師們都已不在人世,可諮詢和請教的前輩都沒有了,但只要數據足夠精良、數據包自帶的說明文件足夠充分,未來,科學家和工程師們照樣可以正常使用。(我在圈內時常聽說,科學家、工程師都是「小短命」的說法。為何不能「超長待機」?累唄。)

在NASA做數據審查是一種怎樣的體驗?



「挑刺黨」科學家的精彩互毆


一幫專業科學家與頂尖工程師之間的巔峰過招


言歸正傳,數據審查的程序是:「新視野」號的數據團隊把飛越冥王星的數據,根據不同的科學儀器進行數據分類,根據數據內容進行分級,然後打包發給NASA行星數據系統負責小天體探測任務的主管科學家。該主管負責挑選和邀請這一學科的科學家加入評審組,把數據審查任務分配給相應的科學家。接受任務後,每位評審組成員將拿到一個網路密匙,可以從辦公室遠程下載需要審查的數據,開始各種檢查。

一周後,主管科學家把評審組成員召集到位於馬里蘭大學的NASA行星數據系統小天體數據中心,與「新視野」號任務負責數據處理的科學家們進行面對面的質疑和討論,俗稱「互毆」。


這不是普通的「互毆」。這是一幫專業「挑刺黨」科學家與頂尖行星數據處理工程師之間的巔峰過招。「挑刺黨」們長期使用這類數據,經驗老道,眼光犀利。工程師們對數據處理源代碼爛熟於胸,對「挑刺黨」們的各種質疑見招拆招,快速做出回應。兩邊思路清晰,反應極快,「互毆」效果奇佳。從早上8點開始開會,持續工作到下午6點,交戰雙方神經緊繃、全神貫注,全程參與討論,差點把我累成腦癱。


我負責審查「新視野」號上的高解析度相機拍攝的數據包。看完第一遍,感覺「冥!王!星!數!據!太!完!美!了!」這些數據不僅能用,還很好用,乍一看真沒什麼破綻嘛。


於是,我焦慮地找俺們老大諮詢,老大也沒多說什麼,簡單地給我看了看他從另一組數據中挑出的毛病,滿滿十幾頁 PPT。看完後,我忍不住說他是雞蛋裡面挑骨頭,他卻說我的要求太低了,讓我「滾」回去重新審查。

然後,我用苛刻到近乎找茬的心態,開始詳細地檢查數據,終於被我發現了好幾個bug。我滿心歡喜地帶著審查意見到評審會,結果發現,這一數據的主審科學家寫了滿滿24頁的審查結果。當時我就傻眼了,原來我的標準還是太、太、太低了。

在NASA做數據審查是一種怎樣的體驗?



全是乾貨的獨立評價


沒有格式模板,沒有固定套路,沒有客套話


作為一名曾長期混跡中國科研體系的有志青年,初次參加美國科學家的評審會,還是深有感觸的。


首先,會場布置極度簡化,沒有領導講話,沒有主席台,沒有桌牌,沒有橫幅標語,沒有合影留念,沒有服務員,沒有專人負責會務,主管科學家是一位大美女,這些事她一人全包辦了,簡單高效。


評審會包吃住、包停車,中途也會有美味的茶歇。我點了蟹肉三明治,挺好吃,但份量太大,我只吃了不到一半,剩下的全浪費了。會議記錄全程高能,實實在在,足夠證明科學家們對數據審查付出的努力了。


雖然科學家們對行星科學數據的格式和質量要求很高,但對評審過程用到的報告、記錄和各種文檔卻沒有任何格式要求,是真正的去形式化,只重內容的務實風格,沒有了形式困擾,科學家和工程師得以把精力都集中在如何讓數據更加精良的實際問題上。


想想我曾經寫過的套著雙層「封面」、有繁瑣的「簽發」、「表頭」、「引用文件」、「質量管理」等內容的一大堆文檔,經常十幾頁後才能翻到正式內容,我想說,真正保質保量的辦法是耐心花時間去做實事,繁瑣的文檔格式對項目管理真的是種阻礙。


跟幾乎所有我來美國後開過的會一樣,數據審查會議同時支持遠程參與,幾位科學家通過網路會議服務商的軟體從歐洲和美國西海岸在線參加了會議。還有,對美國的各種會議,我最欣賞的一點是「無!紙!化!」,一切通過電子版實現,簡單輕鬆。


「新視野」號任務堪稱完美,獲得的數據確實質量優良,但在嚴謹的科學家們的審視下,每個儀器的數據包仍然被挑出了數十頁的問題和毛病。「挑刺黨」陳述數據存在的各種問題,被審查的數據處理團隊一一反駁或提出解決辦法,這個過程實在精彩,全程無尿點。


數據審查是一件嚴肅的事情,一方毫不留情的提出問題、攻擊對方,針針見血;另一方認真應對、見招拆招。 但討論的雙方卻始終氣氛融洽,會場洋溢著歡樂的氣氛。


每一個評價都是獨立研究的成果,沒有格式模板,沒有固定套路,沒有客套話,全都是實實在在的乾貨。「挑刺的」以找出問題為本分,「被挑刺的」以解決改進為己任,相互的「掐架」其實是負責任的合作。因為雙方的目的不是要把誰打到在地,而是要留下一份經得起歷史檢驗和全球用戶審查的科學遺產。


需要指出的是,拼寫錯誤之類的瑣碎小 bug 絕對不會拿到會上興師動眾來討論,直接發郵件清單要求改掉就完事了。真正會拿到會上討論的,都是影響數據使用的重要bug,甚至偶爾還會上升到用戶體驗的哲學層面。


當然,出於職業操守,我不會分享數據審查的細節,也不便舉具體例子,更不會對比中美雙方科學界會議的差異。我只是希望向大家展現這幫超有責任心、高智商、低笑點的科學家「互毆」是什麼樣子。跟他們在一起工作是一種享受。


碎碎念了這麼多,也不知道表達清楚沒有。我承認,我特別想跟大家「嘚瑟」一下參與數據審查的過程,但這不是我寫文章的初衷。科學沒有國界,我的目的是希望更多人看到NASA令人敬佩的數據態度,以及美國科學家高效的評審會流程。不管是同行還是外行,希望能帶給大家一些啟發。


特別喜歡這篇文章,希望更多人能明白,在這個世界上,除了追逐功名利祿的浮誇,還存在著這麼一種求真務實的嚴謹。這就是做科學研究的態度,向所有孜孜不倦的科研人員致敬!


ps:以下是「太空聯盟」的二維碼,感興趣的朋友歡迎關注。

在NASA做數據審查是一種怎樣的體驗?



請您繼續閱讀更多來自 三體迷 的精彩文章:

從零維到四維!看完你能想像出四維空間的樣子嗎?
科學家在鄰近的原行星盤中發現甲醇!
歐南台拍下一張1200光年外的照片,神秘斑點讓人驚喜!
再次探測到引力波!你可知道為何雙黑洞合并會產生引力波?
NASA公布了一組火星探索海報,感染力爆棚!
您可能感興趣

你知道怎樣在NAS上備份數據嗎?
Face ID數據一旦泄露,想修改密碼?蘋果:對不起,沒有這個選項
Tinder用戶真的都是為了約炮么?這有一組調查數據!
NBA五大疑似刷數據行為,為了數據也是夠拼的!
在哪裡能看到全面細緻的 NBA 數據統計?
NBA哪些數據是理論上不可能被打破的?
LOL現役LPL第一上單?對,就是AJ!僅憑一項數據證明自己
細數NBA奇葩數據,你們真的不是故意的嗎?
NBA五大奇葩數據,總有一個讓你想不到!
SPSS23:配對檢驗數據為啥要在兩個變數中?
使用SAS做數據分析強在哪
Type-C 數據線橫評 怎樣才算是一款好的數據線
Type-C 數據線橫評 怎樣才算是一款好的數據線
NBA歷史上,只有庫里在季後賽打出過這樣的數據!
看完這些數據,證實了哈登應成MVP!
重磅,Science:DNA像硬碟一樣存儲數據
作為NBA球迷的你,你的偶像的這些數據你可一定要知道!
小數據學習對 AI 究竟有著怎樣的影響?
NBA如今是數據爆炸的時代!