當前位置:
首頁 > 科技 > Azure CTO:磁帶仍然是歸檔存儲層的首選

Azure CTO:磁帶仍然是歸檔存儲層的首選

如今業界把太多的注意力放在了儘可能提高訪問數據的速度上,不過這是有代價的。在一些情況下(通常歸因於法規),有必要將數據存儲更長的時間,超過預期使用的時間。

拉西諾維奇在澳大利亞為Azure的澳大利亞中部1號和澳大利亞中部2號(堪培拉)地區開幕。

微軟Azure首席技術官馬克?拉西諾維奇(Mark Russinovich)表示,微軟在評估了包括藍光和磁碟在內的各項技術後得出了這個結論:磁帶仍然是Azure的歸檔存儲層的首選。

「我們認為磁帶是新的磁帶」,於是微軟構建了一批自動化磁帶庫,它們裝有多達72個磁帶驅動器和12000隻磁帶盒,另外還有一兩個機械臂以裝載所需的磁帶盒。

他解釋,缺點是因而導致了高延遲:自動化機械臂要將磁帶盒裝入到空閑的磁帶驅動器,然後驅動器要在磁帶上找到合適的位置,才能開始讀取數據。

這種存儲方案在規模相當大的環境下經濟實惠,但是對於新的Azure地區來說,起點成本相當高昂。在過去的五六年間,微軟Azure一直在與微軟研究院合作,開發一款規模較小的歸檔存儲解決方案。因此推出的第一代Pelican系統裝有1100隻硬碟,一個機架的原始存儲容量就超過11PB。兩台伺服器通過PCIe匯流排連接到這些驅動器。

問題在於,如此多的旋轉驅動器需要足夠功率,通常遠遠超過了分配給單個機架的功率預算(power budget)。微軟最後克服了這個局限性,辦法是只在實際需要驅動器時才讓它們轉動起來。拉西諾維奇解釋道,在任何時候只讓一小部分驅動器轉動起來使機架保持在功率預算的範圍內。

代價是延遲較高。如果最大數量的驅動器已經運轉起來,當一隻驅動器處於空閑、停止轉動,就會有初始延遲。然後,所需的那隻磁碟必須轉動起來,之後才能讀取數據。

他說:「但這樣一來就在磁帶與標準硬碟存儲之間留有中間價位。」

微軟並沒有躺在功勞簿上:它正在研究兩項技術,有望以低於磁帶的價格提供歸檔存儲。

Project Silica(硅石項目)是微軟研究院、Azure和英國南安普敦大學三方合作的一個項目,旨在將數據存儲在玻璃上。

這種系統的優點是數據一旦寫入,真正具有永久性。固態硬碟(SSD)、磁碟和磁帶需要數據每隔幾年或每隔十年重寫以避免比特腐爛(bit rot),「如果你可以將數據存儲在玻璃上,根本不存在任何數據失效。它實際上會將數據一直保存下去,直到地球滅亡那天,」拉西諾維奇如是說。

此外,由於主要原材料是沙子,玻璃的成本極其低廉。

唯一的絆腳石是,很難在不損害介質完整性的情況下將數據蝕刻到玻璃上。使用標準的激光器來蝕刻數據會帶來細微裂縫,最終導致數據無法讀取出來。

Project Silica使用能夠生成毫微微秒(千萬億分之一秒)這麼短的脈衝的激光器,從而解決了這個問題。項目研發人員還將三個比特的數據編碼成一個三維像素(voxel,即三維空間中的一個點),並將數據寫入到一片玻璃裡面的多層。

他說:「玻璃具有另一個非常棒的特點,你總是可以研製玻璃讀取裝置。為了讀取玻璃,你只需要光束。你需要來自玻璃的反射。」

拉西諾維奇說:「但是說到以一種效率非常高、成本非常低的方式對數據進行歸檔存儲,那不是唯一大有前景的技術。」

Project Palix旨在將數據編碼到DNA鏈中,這是微軟研究院、Azure和美國華盛頓大學三方合作的一個項目。

如果在10攝氏度左右的環境下存儲起來,DNA可以保存約2000年,還可以使用現有的基因測序技術來讀取數據。

真正的希望在於出眾的密度:一個機架就能存儲多達1澤位元組(ZB)的數據。1澤位元組是1000艾位元組(EB),1艾位元組是1000拍位元組(PB),而1拍位元組是1000兆兆位元組(TB)。為了讓讀者了解數據量有多龐大,拉西諾維奇換了一種方式來解釋:「人們估計到2020年,整個地球上會有大約20ZB的數字數據。也就是說,地球上二十分之一的數據存儲在單單一個機架上。」

他說:「我們認為,我們即將在不久的將來使這項技術在商業上可行。這在提供成本極低的歸檔存儲方面具有巨大的潛力。」


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雲頭條 的精彩文章:

國家安全監管總局「安全生產監管信息化工程」中標結果公布
開發者鍾愛新潮的編程語言,但會函數式編程賺的錢更多!

TAG:雲頭條 |