當前位置:
首頁 > 科技 > 分散式資料庫概述

分散式資料庫概述

一、前言

隨著傳統的資料庫技術日趨成熟、計算機網路技術的飛速發展和應用範圍的擴充,資料庫應用已經普遍建立於計算機網路之上。這時集中式資料庫系統表現出它的不足:數據按實際需要已在網路上分布存儲,再採用集中式處理,勢必造成通信開銷大;應用程序集中在一台計算機上運行,一旦該計算機發生故障,則整個系統受到影響,可靠性不高;集中式處理引起系統的規模和配置都不夠靈活,系統的可擴充性差。在這種形勢下,集中式DB的「集中計算」概念向「分布計算」概念發展。分布計算主要體現在客戶機/伺服器模式和分散式資料庫體系結構兩個方面。

二、分散式資料庫系統概述

隨著傳統的資料庫技術日趨成熟、計算機網路技術的飛速發展和應用範圍的擴大,以分散式為主要特徵的資料庫系統的研究與開發受到人們的注意。分散式資料庫是資料庫技術與網路技術相結合的產物,在資料庫領域已形成一個分支。分散式資料庫的研究始於20世紀70年代中期。世界上第一個分散式資料庫系統SDD-1是由美國計算機公司(CCA)於1979年在DEC計算機上實現。20世紀90年代以來,分散式資料庫系統進入商品化應用階段,傳統的關係資料庫產品均發展成以計算機網路及多任務操作系統為核心的分散式資料庫產品,同時分散式資料庫逐步向客戶機/伺服器模式發展。

三、DDBS(Distributed Database System)的分類

(1)同構同質型DDBS:各個場地都採用同一類型的數據模型(譬如都是關係型),並且是同一型號的DBMS。

(2)同構異質型DDBS:各個場地採用同一類型的數據模型,但是DBMS的型號不同,譬如DB2、ORACLE、SYBASE、SQL Server等。

(3)異構型DDBS:各個場地的數據模型的型號不同,甚至類型也不同。隨著計算機網路技術的發展,異種機聯網問題已經得到較好的解決,此時依靠異構型DDBS就能存取全網中各種異構局部庫中的數據。

四、DDBS的特點和優缺點

DDBS的基本特點:

(1)物理分布性:數據不是存儲在一個場地上,而是存儲在計算機網路的多個場地上。

(2)邏輯整體性:數據物理分布在各個場地,但邏輯上是一個整體,它們被所有用戶(全局用戶)共享,並由一個DDBMS統一管理。

(3)場地自治性:各場地上的數據由本地的DBMS管理,具有自治處理能力,完成本場地的應用(局部應用)。

(4)場地之間協作性:各場地雖然具有高度的自治性,但是又相互協作構成一個整體。

DDBS的其他特點

(1)數據獨立性

(2)集中與自治相結合的控制機制

(3)適當增加數據冗餘度

(4)事務管理的分布性

DDBS的優點

(1)具有靈活的體系結構

(2)適應分散式的管理和控制機構

(3)經濟性能優越

(4)系統的可靠性高、可用性好

(5)局部應用的響應速度快

(6)可擴展性好,易於集成現有的系統

DDBS的缺點

(1)系統開銷較大,主要花在通信部分 。

(2)複雜的存取結構(如輔助索引、文件的鏈接技術),在集中式DBS中是有效存取數據的重要技術,但在分散式系統中不一定有效。

(3)數據的安全性和保密性較難處理。

五、數據分片

類型:

(1)水平分片:按一定的條件把全局關係的所有元組劃分成若干不相交的子集,每個子集為關係的一個片段。

(2)垂直分片:把一個全局關係的屬性集分成若干子集,並在這些子集上作投影運算,每個投影稱為垂直分片。

(3)導出分片:又稱為導出水平分片,即水平分片的條件不是本關係屬性的條件,而是其他關係屬性的條件。

(4)混合分片:以上三種方法的混合。可以先水平分片再垂直分片,或先垂直分片再水平分片,或其他形式,但他們的結果是不相同的。

條件:

(1)完備性條件:必須把全局關係的所有數據映射到片段中,決不允許有屬於全局關係的數據卻不屬於它的任何一個片段。

(2)可重構條件:必須保證能夠由同一個全局關係的各個片段來重建該全局關係。對於水平分片可用並操作重構全局關係;對於垂直分片可用聯接操作重構全局關係。

(3)不相交條件:要求一個全局關係被分割後所得的各個數據片段互不重疊(對垂直分片的主鍵除外)。

六、數據分配方式

(1)集中式:所有數據片段都安排在同一個場地上。

(2)分割式:所有數據只有一份,它被分割成若干邏輯片段,每個邏輯片段被指派在一個特定的場地上。

(3)全複製式:數據在每個場地重複存儲。也就是每個場地上都有一個完整的數據副本。

(4)混合式:這是一種介乎於分割式和全複製式之間的分配方式。

七、體系結構

數據分片和數據分配概念的分離,形成了「數據分布獨立型」概念。

數據冗餘的顯式控制。數據在各個場地的分配情況在分配模式中一目了然,便於系統管理。

局部DBMS的獨立性。這個特徵也稱為「局部映射透明性」。此特徵允許我們在不考慮局部DBMS專用數據模型的情況下,研究DDB管理的有關問題。

八、分散式資料庫管理系統

接受用戶請求,並判定把它送到哪裡,或必須訪問哪些計算機才能滿足該要求。

訪問網路數據字典,了解如何請求和使用其中的信息。

如果目標數據存儲於系統的多個計算機上,就必須進行分散式處理。

通信介面功能。在用戶、局部DBMS和其他計算機的DBMS之間進行協調。

在一個異構型分散式處理環境中,還需提供數據和進程移植的支持。這裡的異構型是指各個場地的硬體、軟體之間存在著差別。

九、小結

(1)「分布計算」概念突破了集中式DBS的框架,數據分布使系統走上分散式DB的道路,功能分布使系統走上C/S道路。這是DBS的兩個發展。

(2)C/S系統包括一個計算機網路,通常用一個區域網連結。幾乎在所有情況下,客戶機都是微機;伺服器有時用小型機或大型機,但多數情況下也使用微機或高檔微機。應用程序在客戶機上處理,DBMS和OS的數據管理分放在伺服器上。

(3)C/S結構經歷了從兩層、三層到多層的演變過程。總的趨勢是使客戶機越來越「瘦」,變成瀏覽器;而伺服器的種類越來越多,容易實現系統的組裝。

(4)C/S系統使應用與用戶更加貼近,為用戶提供較好的性能和更複雜的界面。

(5)分散式系統是在集中式系統的基礎上發展而來的。DDB是資料庫技術與網路技術結合的產物。隨著計算機網路技術的飛速發展,DDBS日趨成為資料庫領域的主流方向。

(6)DDB具有數據分布性和邏輯整體性的特點。DDBS能夠支持涉及多個場地的全局應用。DDB的數據存儲有數據分片和數據分配兩種策略。

(7)DDB的模式結構為理解DDBS提供了一種通用的概念結構。分布透明性是DDBS追求的目標。DDBMS是負責管理分布環境下,邏輯集成數據的存取、一致性、有效性和完備性的軟體系統。

(8)DDBS中數據分布在各個場地,系統中壓倒一切的性能目標是盡量減少網路中傳送信息的次數和傳送的數據量。分散式查詢中基於半聯接的優化策略是常用的技術。

(9)對於並發控制和恢復,DDBMS環境中會出現大量在集中式DBMS環境中碰不到的問題。分散式的並發控制有主場地方法和主拷貝方法,再輔之於備份場地技術。

來源:振河

網址:http://kb.cnblogs.com/page/182488/

【寬客網路課堂】石破天驚之作:可量化的期貨基本面策略

本課程為台灣著名專家林洸興先生的傾力之作。與目前市場上大多數泛泛而論的期貨分析課程不同,「深刻」、「邏輯」兩個詞可以概括本課程的特點。結合量化的需求與特點,林先生特意在本系列課程中將可量化的基本面因素提煉出來講述。從這樣一個獨特的角度講解期貨策略,相信本課程是一個石破天驚的課程。

點擊展開全文

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 大數據實驗室 的精彩文章:

如何在人工智慧大數據時代有效建立起自己的優勢
一文讀懂遺傳演算法工作原理
圍棋中的數學原理
哈佛數學系150年:從三流學繫到世界中心
深度:區塊鏈的中國騙局

TAG:大數據實驗室 |

您可能感興趣

了解資料庫分片
資料庫、分散式賬本與區塊鏈
區塊鏈技術結合分散式資料庫實踐
分享:淺談資料庫引擎
資料庫技術分享:淺談資料庫連接
從架構特點到功能缺陷,重新認識分析型分散式資料庫
國產資料庫發展現狀分析
技術分析:資料庫範式那些事
資料庫新兵:分散式實時分析內存資料庫eSight
開源分散式資料庫能否支撐銀行海量非結構化數據應用?
資料庫的服務化切分
左耳朵耗子:分散式系統架構經典資料推薦
架構設計原則:資料庫拆分六大原則
白碩:區塊鏈+開源資料庫≥商業資料庫
左耳朵耗子:分散式系統架構經典資料
資料庫sql優化總結之百萬級資料庫優化方案+案例分析
區塊鏈,一種非常特殊的分散式資料庫
區塊鏈資料庫與現有資料庫系統之比較
資料庫使用經驗分享
5分鐘學會如何玩轉雲資料庫組件