?
?
1、數據分布的定義
數據分布是指在分布式環境中通過合理分布數據,提高數據操作自然并行度,以達到最優的執行效率的目的。在構建分布式數據庫系統運行環境時,必須考慮數據如何分布在系統的各個場地上。
數據分布主要關注的問題是在分布式數據中,如何合理的放置數據,從而使得相關數據之間的相對位置最合適。
2、數據分布的內容
數據分布的內容主要有數據位置存放問題、高效的數據劃分問題兩個方面。
數據位置存放問題:主要是研究如何把已經劃分好的數據合理放置在網絡上,以獲得最優的執行效率,從而減少網絡傳輸的數據量。
高效的數據劃分問題:如何把數據合理的劃分開,使得使用率最高的數據能被放置在性能最好的節點上。
3、數據分布的策略
3.1 集中式
所有的全局數據片都安排一個節點上。
優點:因為數據都存放在一個節點上,對數據的控制管理比較容易、數據的一致性、完整性能夠得到保證。
缺點:節點負擔太重,容易出現性能瓶頸、節點依賴性太強,如果該節點出現故障,將使整個系統崩潰、可靠性相對較差。對節點設備要求會很高。
3.2 分割式?
所有全局數據有且只有一份,它們被分割出若干個邏輯片段,每個邏輯片段被分別指派在特定的節點上,對全局數據進行了劃分。
優點:數據存儲量大、存放在各個節點可以自治檢索和修改數據、因為數據是分布在多個節點上的,如果部分節點出現故障,系統仍然可以運行、可靠性較好。
缺點:針對全局修改、查詢等操作需要時間會比集中式長一些,因為數據在不同節點需要進行網絡通信。
3.3 復制式?
全局數據有多個副本,每個站點上都有完整的數據副本。
優點:系統可靠性較高、響應速度快、數據恢復很容易。
缺點:保持各個節點的同步修改操作要付出高昂的代價、數據冗余很大。
3.4 混合式
全局數據被劃分為若干個數據子集,每個子集被放在不同的節點上,但任何一個節點上都沒有保持全部的數據,根據數據的重要性決定各個數據子集副本的數量。
優點:兼顧了分割式和復制式的優點、靈活性好、可以提高系統的效率。
缺點:包括了分割式和復制式的復雜性。
IT技術分享社區
個人博客網站:https://programmerblog.xyz
文章推薦程序員效率:畫流程圖常用的工具程序員效率:整理常用的在線筆記軟件遠程辦公:常用的遠程協助軟件,你都知道嗎?51單片機程序下載、ISP及串口基礎知識硬件:斷路器、接觸器、繼電器基礎知識