當前位置:
首頁 > 科技 > 「雲」的力量崛起,資料庫市場再起波瀾

「雲」的力量崛起,資料庫市場再起波瀾

資料庫市場形成今天的格局已經很久了,商業資料庫為王,這幾乎沒有變過。不過,雲來了,以AWS、阿里云為代表的雲服務商攜雲原生資料庫發起了新一輪挑戰。與以往歷次的挑戰不同,這次的競賽換了賽道。

3月21日,阿里雲對外發布了POLARDB v2.0。此前的POLARDB針對的是MySQL用戶,這一次POLARDB還可以兼容Oracle資料庫。據悉,這也是首個兼容 Oracle的雲原生資料庫,可幫助金融、醫療、製造等大型企業在數小時內完成業務遷移,10TB數據備份只需10分鐘。

因雲而生的POLARDB

資料庫誕生於上個世紀70年代,經過這些年的發展,無論是技術還是市場格局都已經趨於穩定,因此市場很長時間以來一直處于波瀾不驚的狀態,不過,雲時代的到來打破了這種平靜,因為在雲時代傳統資料庫面臨很多新的挑戰,這就給了新生的雲原生資料庫以機會。

在2019阿里雲峰會·北京站上,阿里雲智能總裁張建鋒在演講時曾提到了雲給這個世界帶來的三個變化,即IT基礎設施的雲化、核心技術的互聯網化、應用的數據化和智能化。

「基礎設施的雲化需要一套新的系統,需要基於互聯網技術來進行改造。因此,下一代的技術一定構建在互聯網技術和雲化基礎設施上的。」張建鋒表示。

而阿里雲的資料庫POLARDB正是適應基礎設施的雲化而誕生的,正因為此,POLARDB這類資料庫也被稱為雲原生資料庫,包括AWS的Aurora也是這一類型的代表。

實際上,阿里雲早期也是傳統資料庫的使用者,正是因為雲的誕生,因為自身業務不斷成長,發現傳統資料庫越來越難以滿足自身的需求,才有了自研的雲原生POLARDB。

「阿里的業務很複雜,數據量很大,隨著業務的發展,基於開源資料庫的分布分表中間件的解決方案已經不能滿足。這就是POLARDB誕生的直接原因。」阿里雲智能資料庫產品線總負責人李飛飛說。

「雲」的力量崛起,資料庫市場再起波瀾

打開今日頭條,查看更多圖片

阿里雲智能資料庫產品線總負責人李飛飛

享受雲等諸多技術紅利

作為一款誕生於雲時代、一開始就架構在雲平台之上的雲原生資料庫天生地具有很多優勢。比如,彈性伸縮能力就是雲原生資料庫最重要的特點,即當用戶業務量低的時候,就少分配資源;當業務負載高的時候,通過只讀節點等逐漸擴展的方式,讓資料庫支持業務的增長。這種彈性伸縮的能力還帶來另一個好處,就是按需付費,成本節約。所以,雲原生資料庫往往具有更高的性價比。

「傳統資料庫的典型架構就是單節點架構,有存儲引擎、查詢引擎和優化器引擎,再上面是SQL Parser,這一套架構中存儲和計算是綁定在一起的,而雲原生資料庫存儲與計算是分離的。」李飛飛表示。

李飛飛介紹說,POLARDB採用的是分散式共享存儲架構,計算與存儲分離。由於計算與存儲的解耦,存儲就可以通過RDMA高速網路做成一個分散式存儲,而看起來仍然像一個本地盤。正是由於採用了計算與存儲分離的架構設計使得POLARDB的最大數據容量可以達到100TB,這是開源資料庫難以企及的,也成為POLARDB很多早期用戶採用它來取代MySQL的一個主要原因。

除了藉助RDMA等網路技術實現彈性伸縮能力之外,POLARDB還享受了很多現代技術的紅利。比如,POLARDB採用了英特爾的傲騰——這是一種訪問速度介於內存和SSD之間的新型存儲介質,如果需要擴容,可以在5分鐘之內完成節點規格的升級和進行只讀節點的擴展,極速適配。

實際上,傲騰的對資料庫的影響不只是快速,它也在一定程度上改變了資料庫的設計邏輯,讓數據一旦寫了之後實時就可持續性了,持久化了。

另外,像GPU加速在POLARDB中也有採用。在POLARDB中一些重複性或相似性比較高的計算,會Offload到FPGA來做,通過FPGA的定製化的計算模塊重複調用,來節省CPU的時間,從而帶給用戶更好地體驗。

不斷升級的產品

POLARDB也在不斷升級,目前阿里雲還在研發POLARDB的分散式版本,今年會宣布公測。該版本的目標客戶是業務數據量超過單機資料庫的承受能力,業務複雜對資源彈性要求高,例如要求數據不丟失,系統高穩定高可用。

據悉,它能支持更海量的數據、更高並發的處理能力,基於阿里的核心業務十餘年打磨,圍繞高效低成本存儲引擎X-Engine,提供企業化高可用的X-Paxos協議實現。

李飛飛介紹,POLARDB分散式版本的一大特性就是解決了分庫分表問題。早期互聯網公司採用基於中間件技術的分庫分表技術解決資源擴展問題,但這會大大增加系統的複雜度和對應用的侵入。因為很多時候這意味著業務邏輯的重構、軟體的改寫,成本非常高。而POLARDB分散式版本具有類似Google Spanner的先進架構,同時又擺脫其昂貴複雜的原子鐘依賴。

「阿里很多大促活動,比如『雙11』,光靠雲原生共享存儲是無法完全解決這個問題。過去兩年,我們一直在研發自己的分散式存儲技術,它的核心思路就是分布分表,但我們不希望用中間件的解決方案。」李飛飛說。

李飛飛解釋說,與基於中間件技術的分庫分表不同,阿里雲希望做一個原生的分散式資料庫,在內核裡面做分布分表,以儘可能減少對業務層的衝擊。現在阿里雲要把分散式資料庫的技術和POLARDB有機地結合起來。

「我們的目標是打造一個通用的商業資料庫,要求非常產品化、標準化,能夠支持不同產品。未來POLARDB分散式版本能夠提供一個基於共享存儲的一寫多讀的雲原生資料庫,同時利用分散式架構能夠快速靈活拓展。這樣,不管是在公有雲上,還是針對線下的一些企業級超大規模的用戶,我們都能夠用POLARDB去統一滿足用戶需求。」李飛飛說。

有挑戰更是機遇

很顯然,在資料庫市場,POLARDB是一個新來者,甚至與AWS的Aurora相比,POLARDB也要晚幾年。但李飛飛認為,作為挑戰阿里雲的資料庫具有自己的獨特優勢,而最大的優勢是背後有阿里的業務在推動。

「任何技術都是業務推動來衍生的,只要你有業務場景,技術就一定會逐步從發展到領先。比如阿里電商『雙11』在世界上就絕無僅有,阿里雲的資料庫必須經受住海量和高並發的實戰考驗。」李飛飛說。

實際上,阿里雲資料庫技術也得到國際諮詢機構的認可,在2018 Gartner資料庫魔力象限中,阿里雲成為國內首個入選的科技公司。

「這代表了阿里雲的資料庫技術已經和頂級資料庫廠商站在了同一個舞台。中國資料庫廠商有這個機會,非常榮幸。不能只說是阿里的功勞,也是整個中國IT產業、中國經濟發展的結果。如果沒有中國數字化經濟的蓬勃發展,我們是不可能取得這樣的成功。」李飛飛說。

李飛飛坦言,作為挑戰者阿里雲資料庫要真正與資料庫巨頭競爭,面臨不小的挑戰。

第一個是阿里雲和傳統資料庫廠商有一個非常大的不同,就是傳統資料庫廠商可以只研發資料庫產品,而阿里雲資料庫還要支持集團的業務,還要服務自己雲上的客戶以及私有雲、混合雲的外部客戶。

「我們面臨的是非常複雜的一個場景:又要研發,又要運維。既要支持集團的業務,又要支持雲上的業務,所以穩定性、安全運維這絕對是我們第一生命線。」李飛飛表示。

第二個挑戰也是李飛飛認為最核心的挑戰,是混合雲部署所帶來的,這裡面既有技術上的挑戰也有業務上的挑戰。比如,你怎麼保證安全、穩定、高效地部署混合雲,混合雲的數據架構如何設計等等。

第三個是數據的安全隱私保護,這是阿里雲資料庫一直不敢放鬆的。

第四點就是智能化大規模落地和應用。當系統越來越複雜,數據量越來越大,運維挑戰越來越高的時候,就必須利用人工智慧、機器學習的技術儘可能地實現自動運維,提高運維效能。

「這些是挑戰也是機遇,阿里雲的業務快速發展正在不斷驅動我們技術的發展,驗證和帶領技術不斷往前走,我們已經走在了雲原生資料庫領域的前列。」李飛飛總結說。

「雲」的力量崛起,資料庫市場再起波瀾

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 至頂網 的精彩文章:

傳聞證實:Nvidia將以69億美元收購Mellanox
區塊鏈與數字智能合約:法律團隊成員可能很快包括專業黑客

TAG:至頂網 |