在 Windows 本地安裝部署 Apache Druid 可以按照以下步驟進行。由于 Druid 是基于 Java 的應用,需要先準備好 Java 環境,然后下載配置 Druid。
一、環境準備
1.?安裝 Java
確保已安裝 Java 8 或以上版本(推薦 Java 11):
- 下載并安裝 OpenJDK:Adoptium
- 配置環境變量:
JAVA_HOME
:指向 JDK 安裝目錄(如?C:\Program Files\Eclipse Adoptium\jdk-11.0.16.101-hotspot
)PATH
:添加?%JAVA_HOME%\bin
驗證 Java 安裝:
java -version
# 輸出示例:openjdk version "11.0.16.1" 2022-08-12
2.?安裝 ZooKeeper
Druid 依賴 ZooKeeper 協調集群,需單獨安裝:
- 下載 ZooKeeper:Apache ZooKeeper(如 3.7.0 版本)
- 解壓到目錄(如?
C:\zookeeper-3.7.0
) - 創建數據目錄:
mkdir C:\zookeeper-3.7.0\data
- 復制配置模板:
powershell
cd C:\zookeeper-3.7.0\conf copy zoo_sample.cfg zoo.cfg
- 編輯?
zoo.cfg
,修改數據目錄:properties
dataDir=C:/zookeeper-3.7.0/data
二、下載并配置 Druid
1.?下載 Druid
從官網下載穩定版本:Apache Druid Releases
解壓到目錄(如?C:\druid-0.25.0
)。
2.?修改配置文件
主要修改內存配置(Windows 默認配置可能過高):
- 編輯?
conf/druid/cluster/coordinator/runtime.properties
,減少內存:properties
druid.service=druid/coordinator druid.coordinator.period=PT30S druid.jetty.threads.max=10 -Xmx512m # 原配置可能為2g,減少到512m -Xms512m
- 類似地,修改其他組件(broker、historical、overlord)的內存配置。
三、啟動服務
1.?啟動 ZooKeeper
cd C:\zookeeper-3.7.0
bin\zkServer.cmd
2.?啟動 Druid
打開多個 PowerShell 窗口,分別啟動以下組件(按順序):
1. Coordinator(集群協調器)
cd C:\druid-0.25.0
bin\start-coordinator.bat
2. Overlord(任務調度)
cd C:\druid-0.25.0
bin\start-overlord.bat
3. Historical(歷史數據服務)
cd C:\druid-0.25.0
bin\start-historical.bat
4. Broker(查詢代理)
cd C:\druid-0.25.0
bin\start-broker.bat
5. Router(可選,統一入口)
cd C:\druid-0.25.0
bin\start-router.bat
四、驗證安裝
1.?訪問控制臺
打開瀏覽器,訪問:http://localhost:8888
應看到 Druid 控制臺界面,顯示集群狀態。
2.?加載示例數據
在控制臺中,點擊?Load data
?→?Quickstart
?→?wikipedia
,提交數據加載任務。
任務完成后,在?Datasources
?標簽頁應看到?wikipedia
?數據源。
3.?執行查詢
在控制臺的?Query
?標簽頁,選擇?wikipedia
?數據源,執行示例查詢:
SELECT COUNT(*) AS cnt FROM wikipedia
應返回查詢結果。
五、常見問題及解決方案
1.?內存不足問題
若啟動時報?java.lang.OutOfMemoryError
,修改各組件的 JVM 內存參數(如?-Xmx512m
)。
2.?端口沖突
若提示端口被占用,修改?conf/druid/cluster
?下對應組件的?runtime.properties
?中的端口配置。
3.?ZooKeeper 連接失敗
確保 ZooKeeper 正常運行,且 Druid 配置文件中的 ZK 地址正確(默認?localhost:2181
)。
4.?Windows 路徑問題
若遇到路徑解析錯誤,確保配置文件中的路徑使用?/
?而非?\
,或使用雙反斜杠?\\
。
六、關閉服務
按與啟動相反的順序關閉各組件(在對應 PowerShell 窗口按?Ctrl+C
):
- Router
- Broker
- Historical
- Overlord
- Coordinator
- ZooKeeper
七、進一步配置
- 持久化存儲:修改?
conf/druid/cluster/common/runtime.properties
,配置深度存儲(如本地路徑或 S3)。 - 多節點集群:在不同機器或端口啟動多個組件實例,配置相互發現。
- 生產環境優化:調整 JVM 參數、增加內存、配置監控(如 Prometheus+Grafana)。
通過以上步驟,你可以在 Windows 本地成功部署并驗證 Druid 單節點環境。若需更復雜的生產環境,建議使用 Linux 或 Docker 部署。