1、數倉的概念和了解--業務的痛點
產生的痛點:數據資產比較模糊、數據的質量比較低、重復建設、代碼的耦合性比較強。
2、數據倉庫中的常見的模型:
1、心型模型:中間是一張事實表,周圍都是維度表。
對于心型模型的主要的特點:
非正規化、不存在漸變維度、有冗余數據、查詢的效率比較高、不用過多的考慮正規化因素,設計維護是比較簡單。
2、雪花模型:指的是在心型模型的基礎上,在維度表上面還存在維度表。
主要的特點:
正規化、數據冗余比較少,有些數據需要連接才能獲取,效率會比較低,規范化操作比較復雜,導致設計后期的維護比較困難 。在實際的應用中會將雪花模型和心型模型結合使用。
3、維度表的設計的方法:
選擇維度、?確定維表、梳理維度關系、定義維度屬性
4、事實表的設計流程:
?5、ONE? DATA數據模型
1、one data? 一種元素只出現一次,在數倉中只能被定義一次。
2、邏輯架構:
數據域:是指一類數據的,比如說在在一個公司中包含不同的部門,每一個部門就類似一個域,例如業務部門可以稱為業務域。
?