這份文件是一份關于CDH(Cloudera's Distribution Including Apache Hadoop)安裝的詳細手冊,主要內容包括以下幾個部分:
1. **前言**:
? ?- CDH是基于Apache Hadoop的發行版,由Cloudera公司開發。
? ?- 相比于社區版Hadoop,CDH提供了更穩定的商用版本,擁有強大的部署、管理和監控工具,且CDH Express版本完全免費。
2. **環境說明**:
? ?- 列出了三臺服務器的名稱和IP地址,所有服務器均使用CentOS 7操作系統。
3. **環境準備**:
? ?- 關閉防火墻、修改hosts文件、設置SSH免登錄、時間同步、系統優化(如禁用交換分區、禁用透明大頁面)、JDK安裝配置、MySQL安裝配置、創建SCM用戶、準備CDH所需目錄以及處理缺失依賴包。
4. **CDH安裝**:
? ?- 詳細描述了下載安裝介質的步驟,包括Cloudera Manager、CDH Parcel包、Kafka CSD包、Kafka Parcel包和MySQL JDBC驅動。
? ?- 安裝Cloudera Manager(CM)的步驟,包括解壓安裝程序、初始化數據庫、配置修改、Parcel上傳和CM服務啟動。
? ?- 使用CM的Web管理控制臺進行Hadoop安裝,包括接受許可協議、選擇安裝版本、Parcel分發、環境檢查、組件選擇、服務分配、數據源配置和系統配置調整。
? ?- 安裝Kafka服務的步驟,包括上傳介質、分配激活Parcel、使用向導安裝。
5. **其他服務增加**:
? ?- 描述了如何增加其他服務,類似于Kafka的安裝過程。
6. **備注**:
? ?- 如何將Hue切換到使用MySQL數據庫。
? ?- 提供了參考學習資料的鏈接。
整個文檔提供了一個完整的CDH安裝和配置流程,適合需要在CentOS 7系統上部署CDH的用戶。
?