科學家造DNA搜索引擎:一千年以後,你還在這裡
圖片搜索是個極好的發明。
尤其是在買買買和網路互懟的時候,特別有用……
GIF
(我平時都看了些什麼?)
這一切都依賴經過訓練的計算機視覺演算法,而華盛頓大學(University of Washington)的計算機科學家路易斯?塞茲(Luis Ceze)卻說,這種辦法將很快過時。
打個比方,假如這世上有一個地方,它專門存放著各類信息,如果你想獲取信息,那麼就必須通過小窗口裡面的管理員,讓Ta帶著你的條件去找相關的所有信息。
我們先假設這個管理員的效率是永遠不變的,但是裡面的信息卻是在不斷增加,而且越來越複雜的。長此以往,我們找到想要的信息就會越來越難。
沒錯,依然是摩爾定律的鍋,配置和演算法永遠都跟不上數據變多變複雜的速度。
如果你還沒聽懂,那麼就請腦補你遛一隻大型犬的畫面:
GIF
上周三,塞茲的團隊發起了一場社交媒體活動,目的是收集來自世界各地的10000張照片,並將它們的像素以DNA的四種組成部分——As、Ts、Cs和Gs分解開來。這利用了近幾年呼聲很高的DNA存儲技術。
2012年,波士頓哈佛醫學院合成生物學家喬治·丘奇領導的研究團隊發明了一種DNA信息歸檔系統,雖說涉及DNA,但它完全不需要利用細胞,用的是一台噴墨印表機,將化學合成的一小段DNA嵌入到一塊微型玻璃晶元的表面。
為了給數字文件進行編碼,研究人員把文件劃分為微小的數據塊。並以組成DNA的四種脫氧核苷酸(鹼基)As、Cs、Gs和Ts來表示這些數據塊,放棄了過去在計算機上的1和0編碼方法。
DNA存儲卡
每條DNA片段還包含了一個數字「條碼」,用來記錄數據在原文件中的位置信息。在讀取信息時,需要DNA測序儀和電腦將所有片段按序重新組合起來,並轉換為數字格式。
談到為什麼要使用這種技術來存儲圖片時,路易斯?塞茲說:「它能存儲數據長達數千年,所以這實際上就是一個時間膠囊。你想永久保存什麼?」
除了時間久遠,這種技術還相當省資源,微軟首席研究員卡林·施特勞斯(Karin Strauss)表示,DNA存儲技術能帶來更高的存儲密度,未來,一個鞋盒那麼多的DNA就足以保存100個大型數據中心的數據。
塞茲的想法也得到了施特勞斯的支持,他們將一起合作,探索DNA圖像搜索引擎的可能。
在將照片中的像素按As、Ts、Cs和Gs分解好之後,每一張照片可能會有成千上萬個獨特的DNA片段,每一個片段都會成為一條線,或是一片藍色的色塊。
就像你百度時輸入關鍵詞那樣,每一條線或是色塊都會成為獨立的信息單元,它將是一系列與圖片視覺特徵相對應的DNA。
這樣10000張圖像就會被濃縮在幾毫升人造DNA中,所有的視覺特徵都被分解之後,所有信息單元上都會附帶特殊的磁性納米粒子塗層。
GIF
還記得這匹馬嗎?
當這個圖片有被搜索的需求時,你需要一個磁鐵(當然不是普通磁鐵)把你需要的信息單元拉出來,測序器和特殊的演算法會將它們轉換成一張圖片。
塞茲說:「這無疑是種複雜的方式,但我們認為DNA的特異性使它的確非常便於處理複雜的視覺數據」。
面子君覺得,這場社交媒體活動可能有點噱頭的成分,而且DNA存儲技術成本太高,畢竟現在圖像搜索引擎還夠用,目前只有美國國防部高級研究計劃局有能力做這事兒。
MIANZI JINGXUAN
GIF
※不能接受火葬?還有冰葬等著你
※2017年沒有厄爾尼諾卻成史上最熱的一年
TAG:面子精選 |