HDFS學習

3.5? HDFS存儲原理

?3.5.1 冗余數據保存

作為一個分布式文件系統，為了保證系統的容錯性和可用性，HDFS采用了多副本方式對數據進行冗余存儲，通常一個數據塊的多個副本會被分布到不同的數據節點上。
?

如圖所示，數據塊1被分別存放到數據節點A和C上，數據塊2被存放在數據節點A和B上。

這種多副本方式具有以下幾個優點：

（1）加快數據傳輸速度

（2）容易檢查數據錯誤

（3）保證數據可靠性

?3.5.2 數據存取策略

?1.數據存放

?第一個副本：放置在上傳文件的數據節點；如果是集群外提交，則隨機挑選一臺磁盤不太滿、CPU不太忙的節點

?第二個副本：放置在與第一個副本不同的機架的節點上

?第三個副本：與第一個副本相同機架的其他節點上

?更多副本：隨機節點

2. 數據讀取

?HDFS提供了一個API可以確定一個數據節點所屬的機架ID，客戶端也可以調用API獲取自己所屬的機架ID

?當客戶端讀取數據時，從名稱節點獲得數據塊不同副本的存放位置列表，列表中包含了副本所在的數據節點，可以調用API來確定客戶端和這些數據節點所屬的機架ID，當發現某個數據塊副本對應的機架ID和客戶端對應的機架ID相同時，就優先選擇該副本讀取數據，如果沒有發現，就隨機選擇一個副本讀取數據

3. 數據復制（采用流水線策略）

當客戶端需要向HDFS中寫入一個文件時，文件首先被寫入本地計算機。

（1）按照HDFS的設置被切分成一定大小的塊，具體大小由HDFS設置。

（2）每個塊都會向HDFS的NameNode節點發起寫請求。

（3）NameNode節點會根據系統中各個DataNode節點的使用情況，選擇一個合適的DataNode節點列表返回給客戶端。

（4）客戶端隨后會將數據首先寫入列表中的第一個DataNode節點，同時將列表傳給該節點。

3 數據復制（采用流水線策略）

（5）第一個DataNode節點在接收到一定數量的數據后，會向列表中的第二個DataNode節點發起連接請求，并把自己已經接收到的數據和列表傳給第二個節點。

（6）第二個節點在接收到數據后，也會向列表中的第三個節點發起連接請求。依此類推。這樣，列表中的多個DataNode節點形成了一條數據復制的流水線。

?3.5.3 數據錯誤與恢復

HDFS具有較高的容錯性，可以兼容廉價的硬件，它把硬件出錯看作一種常態，而不是異常，并設計了相應的機制檢測數據錯誤和進行自動恢復，主要包括以下幾種情形：

? 名稱節點出錯

? 數據節點出錯

? 數據出錯。

1. 名稱節點出錯

名稱節點保存了所有的元數據信息，其中，最核心的兩大數據結構是FsImage和Editlog，如果這兩個文件發生損壞，那么整個HDFS實例將失效。解決方案：

（ 1 ）把名稱節點上的元數據信息同步存儲到其他文件系統，如 NFS ；

（ 2 ）運行一個第二名稱節點，當名稱節點死機后，可以把運行第二名稱節點作為一種彌補，但這種做法有問題，問題在哪？

最優做法： NFS 和第二名稱節點結合用

2. 數據節點出錯

? 每個數據節點會定期向名稱節點發送“心跳”信息，向名稱節點報告自己的狀態。

? 當數據節點發生故障，或者網絡發生斷網時，名稱節點就無法收到來自一些數據節點的心跳信息，這時，這些數據節點就會被標記為“宕機”，節點上面的所有數據都會被標記為“不可讀”，名稱節點不會再給它們發送任何 I/O 請求。

? 這時，有可能出現一種情形，即由于一些數據節點的不可用，會導致一些數據塊的副本數量小于冗余因子。

? 名稱節點會定期檢查這種情況，一旦發現某個數據塊的副本數量小于冗余因子，就會啟動數據冗余復制，為它生成新的副本。

? HDFS 和其它分布式文件系統的最大區別就是可以調整冗余數據的位置。

3. 數據出錯

? 網絡傳輸和磁盤錯誤等因素，都會造成數據錯誤

? 客戶端在讀取到數據后，會采用 md5 和 sha1 對數據塊進行校驗，以確定讀取到正確的數據

? 在文件被創建時，客戶端就會對每一個文件塊進行信息摘錄，并把這些信息寫入到同一個路徑的隱藏文件里面

? 當客戶端讀取文件的時候，會先讀取該信息文件，然后，利用該信息文件對每個讀取的數據塊進行校驗，如果校驗出錯，客戶端就會請求到另外一個數據節點讀取該文件塊，并且向名稱節點報告這個文件塊有錯誤，名稱節點會定期檢查并且重新復制這個塊。

3.6 HDFS數據讀寫過程

? FileSystem 是一個通用文件系統的抽象基類，可以被分布式文件系統繼承，所有可能使用 Hadoop 文件系統的代碼，都要使用這個類

? Hadoop 為 FileSystem 這個抽象類提供了多種具體實現

? DistributedFileSystem 就是 FileSystem 在 HDFS 文件系統中的具體實現

? FileSystem 的 open() 方法返回的是一個輸入流 FSDataInputStream 對象，在 HDFS 文件系統中，具體的輸入流就是 DFSInputStream ；

? FileSystem 中的 create() 方法返回的是一個輸出流 FSDataOutputStream 對象，在 HDFS 文件系統中，具體的輸出流就是 DFSOutputStream 。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/diannao/37936.shtml
繁體地址，請注明出處：http://hk.pswp.cn/diannao/37936.shtml
英文地址，請注明出處：http://en.pswp.cn/diannao/37936.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！