一、Namespace的概述
1.1.集群與命名空間的關系
類似于大集群與小集群之間的關系,彼此之間獨立又相互依存。每個namespace彼此獨立,Namespace工作時只負責維護本區域的數據,同時所有的namespace維護的文件都可以共用DataNode節點,為了區分數據屬于哪些Namespace,DataNode會通過BlockPool的形式進行管理
1.2.管理Namespace的文件
當我們格式化namenode的時候,會產生一個包含 Cluster 相關的信息
- namespaceID:這是命名空間的唯一標識符,它在HDFS集群中標識一個特定的命名空間實例。在HDFS中,每個命名空間都有一個唯一的ID,用于區分不同的命名空間。
- clusterID:這是HDFS集群的全局唯一標識符。所有命名空間和存儲池(Block Pools)都屬于這個集群ID。
- cTime:這是集群的創建時間戳,通常在集群首次格式化時設置。
- storageType:這指明了節點的類型,在這個上下文中是NAMENODE,意味著這個存儲信息是關于NameNode的。
- blockpoolID:這是Block Pool的唯一標識符,它與一個特定的命名空間關聯,并且管理屬于那個命名空間的所有數據塊(Blocks)。Block Pool可以跨多個DataNode,這些DataNode存儲屬于同一個