數據倉庫
這是一個傳統的概念了,趨向于結構化數據,簡單來說就是進過數據治理后的標準數據更易于數據分析使用,代價就是存儲比較昂貴了
數據湖
近些年來新出的一種概念,就是存儲了結構化,非結構化,半結構等數據,也就是不管什么數據先存起來在說,這些數據更易于大模型分析,存儲比較簡單
湖倉一體
結合了上面的兩種模式
盜來的圖:
主要講講在實際應用中,湖倉一體的有點:
- 數據統一存儲:湖倉一體里,數據只存儲一份,這樣流程簡單,輸出數據格式統一,易于管理等
- 存算分離:既存又算,在一些架構中需要兩套系統來維持其穩定性的話,需要將存算進行分離,但是湖倉一體只需要一套系統就能進行存算分離
- 查詢:目前其能滿足mysql結構,也有es高效查詢,用時又兼容hbase列存儲的鍵值查詢
----- -----------------參考文檔