目錄
1.hadoop
????????a.HDFS分布式文件系統
? ? ? ? b.Yarn集群資源管理器
? ? ? ? c.MapReduce sql引擎
? ? ? ? d.Impala sql引擎
? ? ? ? e.工具概觀
2.數據倉庫知識
? ? ? ? a.Hive數據庫
? ? ? ? ? ? ? ? 1)Hive Sql
? ? ? ? ? ? ? ? 2)數據庫結構
? ? ? ? b.Doris數據庫
3.混合處理框架SPARK
? ? ? ? a.Spark
? ? ? ? b.集群架構
4.數倉模型知識
5.開發工具
? ? ? ? a.Dbeaver
? ? ? ? b.Idea
6.kafka
7.實時處理框架flink
轉職開始做大數據了,逐步跟著學習的腳本把知識變成自己的
1.hadoop
????????a.HDFS分布式文件系統
? ? ? ? b.Yarn集群資源管理器
????????????????前端工作流異常時候 yarn檢查異常信息-CSDN博客
????????????????
? ? ? ? c.MapReduce sql引擎
? ? ? ? d.Impala sql引擎
? ? ? ? e.工具概觀
2.數據倉庫知識
? ? ? ? a.Hive數據庫
? ? ? ? ? ? ? ? 1)Hive Sql
? ? ? ? ? ? ? ? 2)數據庫結構
? ? ? ? b.Doris數據庫
3.混合處理框架SPARK
? ? ? ? a.Spark
? ? ? ? ? ? ? ? 1)SCALA
????????????????????????Scala中的選項(Options )-CSDN博客
? ? ? ? b.集群架構
????????????????使用spark進行遞歸的可行方案-CSDN博客
????????????????spark讀取和保存本機文件-CSDN博客
????????????????本機spark 通idea連接Oracle的坑-CSDN博客
4.數倉模型知識
? ? ? ? a.分層邏輯
? ? ? ? b.模型規范
? ? ? ? c.指標檢查
5.開發工具
????????
? ? ? ? a.Dbeaver
? ? ? ? b.Idea
????????????????windows idea本地執行spark sql避坑-CSDN博客