當前位置:
首頁 > 新聞 > 保質幾千年!哈佛大學新研究用蛋白質分子存儲數據,比雲更安全

保質幾千年!哈佛大學新研究用蛋白質分子存儲數據,比雲更安全

新智元報道

來源:harvard

編輯:大明

【新智元導讀】哈佛大學研究人員提出一種用寡肽分子存儲信息的新方法,信息獨立於雲端之外,安全性高,數據寫入後無須額外能量即可穩定存儲幾千年之久,檢索準確率達到99.9%。

書籍可能被燒成灰,電腦可能被黑,DVD會降解無法讀取。儘管近年來信息存儲方式不斷進步,但目前的信息存儲方式仍會遭到或簡單或複雜的威脅的影響。無論是一場洪水、一把火,還是一次複雜的網路攻擊,都可能讓記錄的珍貴信息化為烏有。

哈佛大學的信息服務中心Whitesides團隊的新化學儲存方法(如下圖所示)需要的空間更少,而且無需輸入能量就可存儲大量數據。

到目前為止,Cafferty和他的團隊已經用這種方法記錄、存儲並「閱讀」了物理學家Richard Feynman的著名演講、Claude Shannon(他被稱為「信息理論之父」)和葛飾北齋的畫作《神奈川衝浪里》(右下)。到2020年,全球數字化檔案估計達到44萬億Gb(是2013年的10倍),說是「數字化海嘯」馬上就要來了一點也不為過。

隨著數據科學的持續繁榮,越來越多的信息在越來越小的空間中實現交互。即使是雲存儲,最終的空間也會被耗盡,無法阻擋所有黑客,同時要消耗大量能量。

蛋白質分子存儲信息:能耗低、安全性高、保質期超長

現在,哈佛大學George Whitesides團隊提出一種存儲信息的新方法,可以將數據穩定存儲達數百萬年之久,數據不與容易被破解的互聯網相連,數據一旦寫入,就不會消耗能量。這個方案只需化學家、一些廉價分子和您寶貴的信息就可實現。

「想想看,用一茶匙蛋白質就能保存紐約公共圖書館的全部內容,」Brian Cafferty博士說,他是描述該技術的論文的第一作者,目前在George Whitesides博士的實驗室中擔任博士後研究員。同時參與該研究的還有美國西北大學的Milan Mrksich博士及其團隊。該團隊在ACS Central報告了他們的新方法。

「至少在現階段,我們認為這種方法還不會與現有的數據存儲方式處於競爭關係,」Cafferty說。「我們認為這個方法是對現有技術的補充,從初步目標來看,我們的方法非常適合長期存檔數據的存儲。」

論文一作Brian Cafferty

Cafferty的分子存儲工具可能無法取代雲,但可以為DNA等生物儲存工具提供一種誘人的替代方案。最近,科學家們發現了DNA編碼的不僅僅是眼睛的顏色。研究人員現在能夠通過合成DNA鏈來記錄任何信息。

但是,雖然DNA與計算機晶元相比較小,但放在分子世界中來看,DNA的個頭就很大了。而且DNA的合成需要熟練且時常重複的勞動。如果存儲每條消息都需要從頭開始設計,那麼大分子存儲可能會成為一種耗時長、成本高的方式。

不同分子量的寡肽注入「微孔」,以二進位編碼區分

「我們開始探索一種未從生物學中借鑒的新策略,」Cafferty說。「通過使用有機化學和分析化學中常見技術,開發出一種使用低分子量的分子來編碼信息的方法。」

只需一次合成就可以生成足夠的小分子,一次編碼多個視頻,這種方法比基於DNA的方法更省力,更便宜。團隊選擇了寡肽(兩個或多個結合在一起的肽),因為其分子量很低,而且屬於性質穩定的常見化合物,其分子比DNA,RNA都要小。

由於組成寡肽的氨基酸數量和類型不同,它們的分子質量是有差異的。當不同的寡肽分子混合在一起時,這種差異可以實現相互區分,就像字母表中的不同字母一樣。

將這些「字母」組成單詞會有點複雜:將不同質量的寡肽存儲在384個「微孔」中,然後將寡肽混合物放置在金屬板的表面上,就像將墨水吸收存儲在書頁中一樣。如果想要讀取「寫下」的內容,可以通過質譜儀查看其中一個微孔,按質量對分子進行分類。看看這個孔中存在哪些寡肽、不存在哪些寡肽:即實現不同存儲內容的區分。

然後,為了將混亂的分子翻譯成字母和單詞,團隊使用二進位編碼。例如,儲存字母「M」可以使用八種可能的寡肽中的四種,每種寡肽具有不同的質量。微孔中存在的四種寡肽讀為「1」,而缺失的四種讀為「0」。這些分子二進位代碼分別指向相應的字母,如果存儲的信息是圖像,則指向相應的像素。

使用寡肽存儲的32bits信息原理示意圖

使用這種方法,八種寡肽的混合物可以存儲一個位元組的信息; 32種寡肽的混合物可以存儲四個位元組,以此類推。

現在,這種存儲方式的檢索準確率為99.9%。平均「寫入」速度為每秒8bits,「讀取」速度每秒20 bits。儘管「寫入」速度遠遠超過了用合成DNA書寫的速度,但對於大分子而言,「讀取」速度可能更快、更便宜。

分子存儲方式無須耗能,獨立於互聯網之外,安全性更高

未來,還可以通過引入不同類別的分子,提高存儲的穩定性和容量,並降低成本。實驗中使用寡肽是定製的,因此價格較貴。但未來的圖書館可以購買更便宜的分子(如烷硫醇),只需1美分就可以記錄1億比特的信息。

寡肽等分子具備復原能力。「在適當的條件下,寡肽可以在數百年甚至數千年的時間內保持穩定性。」在高溫和乾旱的情況下,這些分子可以在沒有光或氧的情況下存活下來。而且,黑客無法像攻破雲存儲那樣竊取分子存儲的內容,分子存儲只能通過人工訪問。即使「小偷」發現數據藏匿,也需要一點化學知識才能實現代碼檢索。

Cafferty團隊的可擴展的分子存儲庫是一種穩定的、零能耗、抗腐蝕的存儲可選方案,可用於未來的信息存儲。因此,當未來一旦書被燒了、計算機被黑了,DVD讀不出來了,這些分子可能還會繼續存在,以提醒未來的人類,我們曾經是多麼喜歡那些萌萌的貓咪視頻。

該研究由美國國防部高級研究計劃局(DARPA)資助。

參考鏈接:

https://chemistry.harvard.edu/news/storage-beyond-cloud

論文:

https://pubs.acs.org.ccindex.cn/doi/pdf/10.1021/acscentsci.9b00210


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

消失的千人計劃
Bosque語言問世,超越結構化編程,開啟第二個開發黃金年代

TAG:新智元 |