當前位置:
首頁 > 知識 > 宅男硬碟又不夠用了?你可能需要一個用DNA做的「硬碟」

宅男硬碟又不夠用了?你可能需要一個用DNA做的「硬碟」

宅男硬碟又不夠用了?你可能需要一個用DNA做的「硬碟」



1895年12月28日,來自法國的攝影師盧米埃爾兄弟在巴黎卡布辛路大咖啡館的地下室里,用活動電影機放映了世界上第一部電影——《火車進站》(the arrival of a train)。這段時長僅有50s左右的短片描繪了秋冬之交時的巴黎蕭達車站。當觀眾們看到火車遠遠駛來,好像要衝破銀幕,都大吃一驚,甚至起身逃離……如今,122多年過去了,《火車進站》再次開創先河——它在不久前剛剛成為世界上第一部被儲存於DNA中的電影。

來自紐約基因組中心和哥倫比亞大學的Yaniv Erlich和Dina Zielinski將六份文件:計算機操作系統、電影、照片、科學論文、計算機病毒和亞馬遜禮物卡編碼進這個大名鼎鼎的雙螺旋分子中,這些文件總共2.14×106位元組。


在這項發表於Science期刊上的研究中,研究人員使用了一種基於互聯網流媒體的新方案,將信息高效地儲存進DNA。通過這種方式,他們將數字文件打包成極少量的DNA——一個1TB的DNA「硬碟」僅重150克。理論上,你可以把世界上所有的數據都儲存在一卡車DNA中


事實上,將信息儲存在DNA中並不新鮮。只要生命存在,這一過程就一直在進行。DNA分子看上去像一個螺旋梯,它們的階梯由四種鹼基——A、T、C、G構成。這些「階梯」排列的順序編碼著構建一切生物的指令。如果你可以將數字數據——0或1轉化成這四個字母,那麼你就可以用DNA編碼任何東西。


DNA儲存的優勢

為何會想到用DNA來做「硬碟」呢?當然是因為DNA具有其他存儲媒介所不具備的優點:它佔據極少的空間。並且非常耐用,只要保持低溫乾燥和黑暗的環境。來自數千年前滅絕的猛獁象或是幾十萬年前尼安德特人頭骨化石中的DNA仍然可以被提取並測序。軟盤、VHS、壓縮盤、激光碟,盒式磁帶……任何一種現有的媒體格式最終都變被淘汰,每種新格式的出現都會迫使人們去購買新的讀取設備並更新自己的數字檔案。但是,DNA永遠不會過時。它在生命中具有如此重要的地位,以至於生物學家永遠會去研究它。測序儀雖然在不斷改進,但它們總會存在,不會面臨被淘汰的風險。


此前的研究


哈佛大學的George Church早在2011年就進行過DNA存儲,他將自己新出版的一本書,一些圖像和一個Javascript程序編碼進DNA中。一年後,來自歐洲生物信息學研究所的Nick Goldman和Ewan Birney使用更複雜的編碼改進了他的嘗試。他們在一顆DNA微粒中編碼了莎士比亞所有的十四行詩,馬丁?路德?金的「我有一個夢想」演講的剪輯以及一份來自James Watson和Francis Crick的PDF格式論文(文中詳細地描述了DNA結構以及他們研究所的照片),這顆DNA「硬碟」極小,當以至於當它被送到實驗室時,Goldman看到的只是一個空管。


不過,最大問題是,我們只能創造或測序一小段的DNA,大概只有幾百個字母長度。因此,如果你想編碼一大塊數據,你必須將其分解開來,並把它們合并成為一個雜亂的DNA片段。這樣做很難確保所有數據都被均勻地表示,所以有丟失數據位的風險。


Goldman和Birney通過創建重疊代碼來應對這一點,使得每一比特數據由至少四個DNA片段表示。如果其中一個片段丟失,那麼同一信息還存在於另外三個片段中。這確實是個好方法,不過不怎麼高效。並且,這種策略也存在缺陷,在團隊試圖恢復DNA中的數據文件時仍然遇到了一些錯誤。Erlich說,我想我們可以用一些更有效更準確的方法來實現這一過程。」

宅男硬碟又不夠用了?你可能需要一個用DNA做的「硬碟」



工作中的Yaniv Erlich和Zielinski


DNA噴泉碼


無獨有偶,Netflix和Spotify等在線流媒體服務也面臨著類似的問題。他們使用噴泉碼解決了這個問題——一種將數據分割成小數據包(或「水滴」)的編碼方式,通過這種方式你可以恢復整個數據,即使你只能捕獲一個隨機子集。無需擔心錯過了哪些信息,只要能捕獲足夠的「水滴」,你就可以重建整個數據流。 Erlich將這種方式比喻成做一個巨大的數獨謎題:如果一些方塊被填充進去,那麼你可以推斷出其他方塊。

通過使用噴泉碼,研究人員將平均1.6比特數據編碼到每個DNA鹼基中,這種方法比以前的研究高效了60%,並接近DNA所能包含的信息密度的極限——每個鹼基編碼1.8比特數據。「我們非常接近一個最佳配置。」Erlich說。


他們使用這個名為DNA噴泉的系統編碼了:《火車進站》;最小的計算機操作系統KolibriOS;在Pioneer 10和11探測器上發送的圖像;一份論述媒體對信息容納能力的科學論文;一種名為Zipbomb的病毒(它會在你的硬碟里填滿垃圾);和一張50美元的亞馬遜禮品卡。


Erlich和他的同事最終得到72,000個DNA片段文庫,然後對它們進行測序,解碼和重新裝配。在這個過程中,他們丟失了2000多個碎片,但他們最後仍然完美地重建文件。


不過,DNA存儲還有另一個缺點。對片段進行測序這一過程本身也會破壞它們,所以這種存儲介質被讀取得越多,它就消失得越快。 「我的女兒喜歡《冰雪奇緣》,」Erlich說,「如果要編碼《Let it go》這首歌,恐怕幾周內DNA就被耗盡了。」 幸運的是,DNA的特性決定它很容易被複制,所以將DNA編碼的數據緩存翻倍不是什麼難事兒。但是,每次你這樣做,都可能存在引入錯誤的風險:副本的副本很少與原始版本完全一致。好在DNA噴泉碼能夠抵抗錯誤的干擾,即使Zielinski複製數據緩存十次,她仍然可以完全恢復文件。

「這項工作是偉大的,」Birney表示,並證明了DNA存儲「是一個非常厲害的想法。」據說,他和Goldman正在開發他們自己的新編碼方案,他們希望在不久的將來能夠測試及發布。微軟也在採取行動。去年7月,微軟研究員Karin Strauss和華盛頓大學的計算機科學家Luis Henrique Ceze在DNA中存儲了200兆位元組的數據。 「我們相信DNA作為存儲媒介所具備的密度優勢,並正在努力提高容量和系統設計,使其在儲存中更加實用。」他們表示。


成本問題


如果想要DNA存儲成為主流,成本顯然是個大問題。DNA測序仍然不便宜,不過真正昂貴的是DNA合成過程。好在這兩者成本都在下降。當Birney和Goldman在2012年發表他們的研究時,編碼一兆位元組的數據花費了12,400美金。而現在,只需要3,500美元。但即使這些成本進一步下降,合成DNA仍然是一個利基活動。目前世界上還沒有哪種儲存媒介的容量能夠編碼拍位元組(petabyte)的數據。


但是,Erlich相信,隨著他和另一些科學家證明DNA能夠成為未來的儲存格式,成本昂貴的局面或許會逐漸轉變。 「第一台硬碟驅動器需要四個人來扛,」他說, 「經過數十年的廣泛的研究和開發,我們現在有拇指大小的驅動器。目前投入到DNA合成中的錢只是冰山一角。我希望,通過優化方案可以實現DNA存儲的潛力。」


最後,筆者就這一研究諮詢了基因測序的業內人士。他們表示,這一研究雖然十分具有創新性,但DNA要作為儲存媒介廣泛應用還有很長的路要走。拋開成本不談,最明顯的問題就是寫入和讀取數據的過程需要耗費許多時間。因此,DNA硬碟要想發揮實用價值還需依賴於DNA合成技術和測序技術的發展與革新。


附錄:DNA儲存器中文視頻資料

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 生物探索 的精彩文章:

痛失兩子後終獲健康嬰兒,第三代試管嬰兒技術助圓夢
女神來了!基因行業的女神級高管,怎一個美字了得!
國家衛生計生委主任李斌做了這些解答,你的疑惑也在裡面嗎?
請記住這15名女性,她們正在積極改變生物醫藥行業
寒門難出科學家?中美英日巴印肯俄八國如何應對科學領域階級問題

TAG:生物探索 |

您可能感興趣

別再說老用戶不如狗 這些老電腦也能用上NVMe固態硬碟!
怎麼樣可以不用花錢把MacBook 硬碟容量翻倍而且還可能賺一筆?
空間不夠用了?不用怕,硬碟里堆了什麼一目了然
插上SSD系統找不到硬碟,只需掌握這些就夠了
說真的,你為什麼需要一個移動硬碟?
現在固態硬碟都這麼便宜了,還有必要用機械硬碟嗎?
一個裝滿了文件的硬碟會比一個空白的硬碟質量更大嗎?答案是你想不到的
SMR硬碟到底有多坑 看完你就不敢亂買機械硬碟了
換個玩法就不會了?NVME固態硬碟就是這樣裝系統的
電腦用久了內存不夠用?這幾個超大固態硬碟任你用
跑分虛高感覺不到快?你真的需要NVMe固態硬碟嗎?
買了塊固態硬碟,怎麼保養才能用更久?和機械硬碟有什麼不同?
移動硬碟不能這樣用,聽人勸食飽飯!從業者給你的幾個使用建議!
只升級固態硬碟還不夠 用好幾個小技巧讓電腦更快更好用
只用一顆晶元就能替代機械硬碟?只有想不到沒有做不到
什麼樣的電腦才配裝固態硬碟?沒有做不到只有想不到!
心疼自己買的NVMe固態硬碟沒專用驅動?這裡有個免費通用版
不懂怎麼買SSD固態硬碟?學會這四個要訣
手機電腦通用 你可能需要一款無線硬碟
你知道嗎!SSD與機械硬碟不僅僅是速度的差別