在啟動HDFS時，針對集群中namenode無法識別datanode的問題的解決方法

最近由于重裝了系統，需要對之前搭建的集群要做些改動。在對每個虛擬機的網絡進行正確的配置之后，重新執行hadoop/sbin/start-dfs.sh命令來啟動HDFS，然而namenode卻無法識別datanode。
后來通過對之前學過的知識進行回顧和梳理發現了問題的所在：
由于場景的改變造成了虛擬機IP地址的改變，在這里雖然在虛擬機中配置網絡的IP也做了相應的改變，但是Hadoop集群中的一些自動生成舊文件的內容依舊和你以前的IP地址有關，這就造成NameNode無法識別之前的DataNode。
這里寫圖片描述
解決辦法：
首先了解下namenode初始化工作目錄的形成，我們在執行hdfs namenode -format 時只是初始化了namenode的工作目錄，而datanode的工作目錄是在datanode啟動后自己初始化的。所以在這里首先要把各個DataNode下的工作目錄進行刪除（即HDFS的文件存儲目錄：hddata/dfs/current目錄下的內容全部進行刪除）。（如果某個DataNode的工作目錄未進行刪除，則通過相應的web網頁去看HDFS的存儲內存時依舊觀察不到該DataNode）

其次namenode在format初始化的時候會形成兩個標識：
blockPoolId：
clusterId：
這里寫圖片描述
新的datanode加入時，會獲取這兩個標識作為自己工作目錄中的標識，一旦namenode重新format后，namenode的身份標識已變，而datanode如果依然持有原來的id，就不會被namenode識別。
所以只需要我們把各個DataNode上的工作目錄進行刪除后，然后在對hadoop的bin目錄下執行namenode-format命令即可識別DataNode。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/456847.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/456847.shtml
英文地址，請注明出處：http://en.pswp.cn/news/456847.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！