秋意正濃,和存儲大師們來一場美麗的邂逅
秋天的武漢是美麗的,你可以去落雁島看一次夕陽,鸕鶿們結伴飛向遠處,泛著金色漣漪的湖面,倒映在水中,亦或是約上幾個好友一起去木蘭雲霧山打板栗,那裡的板栗不僅個大、肉嫩,而且皮薄、味甜,或者是騎車去東湖綠道,體驗一次東湖綠道中的「郊野道」,在親水場所、林中棧道中穿梭,當然,你還可以參加UCan下午茶的活動,在暖暖的光谷創業咖啡館中,美美的泡上一個下午,接受知識的熏陶。
UCan下午茶是UCloud於2017年啟動的系列技術沙龍。該沙龍不僅會分享UCloud最新的技術重點,同時也會誠邀業界相關方向的技術大咖一同交流、分享。誠意滿滿的乾貨、鮮活生動的案例內容,將使每位參與者不負午後時光,場場「悟」有所值。「UCan下午茶-2018」秉承了去年技術為先、實踐為主的宗旨,堅持為大家分享真正的技術乾貨。而這次的武漢站將給大家帶來分散式存儲方面的精彩內容,希望對分散式存儲感興趣而又身在武漢的朋友能來捧場!
隨著信息時代的到來,人類產生的數據呈指數級增長,傳統存儲逐漸已經無法適應這樣的數據增長速度,因此,分散式存儲系統應運而生。分散式存儲系統將數據存儲在物理上分散的多個存儲節點上,對這些節點的資源進行統一的管理與分配,並向用戶提供文件系統訪問介面,其主要解決了本地文件系統在存儲容量、擴展性、高性能、高可靠等方面的問題。而要談到分散式存儲系統技術,就要先從分散式存儲系統的典型架構講起。
分散式存儲系統典型架構
目前比較主流的分散式文件系統架構,如下圖所示,通常包括主控伺服器(或稱元數據伺服器、名字伺服器等,通常會配置備用主控伺服器以便在故障時接管服務,也可以兩個都為主的模式),多個數據伺服器(或稱存儲伺服器,存儲節點等),以及多個客戶端,客戶端可以是各種應用伺服器,也可以是終端用戶。
分散式文件系統的數據存儲解決方案,歸根結底是將大問題劃分為小問題。大量的文件,均勻分布到多個數據伺服器上後,每個數據伺服器存儲的文件數量就少了,另外通過使用大文件存儲多個小文件的方式,總能把單個數據伺服器上存儲的文件數降到單機能解決的規模;對於很大的文件,將大文件劃分成多個相對較小的片段,存儲在多個數據伺服器上。目前,很多本地文件系統對超大文件的支持已經不存在問題了,如ext3文件系統使用4k塊時,文件最大能到4T,ext4則能支持更大的文件,只是受限於磁碟的存儲空間。
常見的分散式存儲系統
目前,常見的分散式存儲系統有Hadoop HDFS、OpenStack的對象存儲Swift、Ceph、公有雲分散式存儲等。
Hadoop分散式文件系統(HDFS)是一個分散式文件系統,適用於商用硬體上高數據吞吐量對大數據集的訪問的需求。該系統仿效了谷歌文件系統(GFS),數據在相同節點上以複製的方式進行存儲以實現將數據合併計算的目的。該系統的主要設計目標包括:容錯,可擴展性,高效性和可靠性。HDFS採用了MapReduce,不遷移數據而是以將處理任務遷移到物理節點(保存數據)的方式降低網路I/O。HDFS是Apache Hadoop的一個子項目並且安裝Hadoop。
OpenStack Swift提供一個類似Amazon S3的對象存儲。其主要特點為是所有的存儲對象都有自身的元數據和一個URL,這些對象在儘可能唯一的區域複製3次,而這些區域可被定義為一組驅動器,一個節點,一個機架等。
Ceph是一個遵循LGPL協議的存儲平台,它可以在單個分散式節點上同時支持對象存儲,塊存儲和文件存儲。Cphe主要設計的初衷是變成一個可避免單節點故障的分散式文件系統,EB級別的擴展能力,而且是一種開源自由軟體,許多超融合的分散式文件系統都是基於Ceph開發的,作為開源軟體在超融合商業領域的應用,Ceph因為性能等問題被詬病,但不乏許多廠商在Ceph上不斷優化和努力。
公有雲提供的分散式存儲系統則有谷歌的雲存儲、Amazon的S3,微軟的Azure Bolb,阿里的OSS,UCloud的UFS以及雲存儲等。
分散式存儲系統涉及的技術
分散式存儲系統涉及的技術主要涉及介面、穩定性、性能等方面。
介面方面
ISCSI的系統介面可能企業存儲上雲的主要介面,這個方式可以有效兼容當前所有傳統存儲系統的介面形態,同時對於後端定製性更強,有利於快速變化的雲計算技術的迭代更新。
互聯網新業務要求存儲系統在提供塊和文件介面的同時,也需要提供對象存儲、NoSQL等存儲形態,同時在這樣的形態之上需要存儲系統集成圖片處理、視頻處理、特徵提取等更多的計算服務,一站滿足很多用戶公共的處理要求。
穩定性方面
跨數據中心和跨地域的容災將是存儲系統的標準配置,同時對於容災進行動態調整和靈活的定價策略將吸引更多的用戶。
容器技術和只能交換網路需要進一步和存儲系統進行結合,在數據安全和隔離性方面給存儲系統帶來巨大變化。目前基於進程內部的隊列和優先順序控制始終處於被動狀態,不能在源頭上就達到數據流量和優先順序的控制,增加了系統的消耗。
性能方面
存儲節點的數據處理將使用專用硬體設備接管來實現數據處理加速,並將數據處理和存儲數據的過程合併。存儲節點將集成更多的硬體,例如FPGA、RDMA網卡、GPU,這些硬體為特定的數據處理帶來加速效果,同時降低功耗。
操作系統內核將不會再參與數據的I/O處理,所以要依賴數據分散式演算法對內核進程、內存管理和文件系統進行有效對的調度。
存儲大咖悉數登場暢談分散式存儲
而上面這些技術,都將在11月8日武漢舉辦的UCan下午茶活動中得到存儲大咖們的詳細講解。這些大咖們包括:
鄧瑾先後就職於騰訊,七牛,UCloud,負責海量存儲相關的產品開發和運營。在UCloud期間主要負責對象存儲,文件存儲等分散式存儲系統。目前致力於為公司和客戶提供穩定統一的基礎存儲設施。個人技術興趣主要集中於分散式理論,資料庫和文件系統方向。
李明宇,中國新一代IT產業聯盟分散式存儲分委會秘書長,榮獲中國軟體協會「優秀CTO」稱號。在分散式系統領域有十年以上研發經驗,曾在中科院國家級重點實驗室擔任專項課題組技術負責人,現兼任西安交通大學研究生院外聘專家和企業導師。
葉恆,UCloud網路磁碟產品(UDisk)核心研發工程師,主導和參與網路磁碟從老架構到新架構的整個設計和研發過程,目前正在研發超高性能存儲框架。對服務後端技術、存儲技術,高性能存儲有豐富的研發經驗。
盧波,深信服存儲研發專家,8年存儲設計開發經驗,負責過統一存儲、超融合存儲的架構設計和開發,目前主要負責深信服分散式存儲(EDS)的產品規劃。個人對文件系統,對象存儲和大數據比較感興趣。
他們將為來參加此次UCan下午茶的觀眾帶來包括UCloud 分散式文件系統產品架構解析、分散式存儲中的數據分布演算法、雲硬碟架構升級和性能提升詳解以及基於CephFS的改進及優化等相關內容的講解。
怎麼樣,這些大咖陣容夠豪華吧?演講內容夠勁爆吧?那你就不要猶豫了,現在會場門票還有少數空餘,趕緊抓緊時間報名吧!
時間:2018年11月10日 下午13:00
地點:武漢 青年眾創空間光谷創業咖啡
地址:大智街辦事處解放大道1435號青少年宮體育館一樓(地鐵一號線、二號線,循禮門站)
猛擊下列鏈接報名:
https://bss.csdn.net/cview/reg/?project_id=3831&identy_id=1957


※是時候丟棄 Python 2.0,將 100 萬行的代碼遷移到 Python 3.0 了!
※亞馬遜科學家將人工智慧助理日常化的夢想照進現實
TAG:CSDN |