? ? ? ? ? ? ?
?
1、數據倉庫介紹
數據倉庫(DW):可以滿足管理人員的決策分析需要,在數據庫基礎上產生了滿足決策分析需要的數據環境。
傳統數據庫和數據倉庫比較 | ||
比較內容 | 傳統數據庫 | 數據倉庫 |
數據內容 | 當前數據 | 歷史的、存檔的、歸納的、計算的 |
數據目標 | 面向業務操作員,重復處理 | 面向主題、分析應用 |
數據特性 | 動態變化、按字段更新 | 靜態、不能直接更新、只能定時添加、刷新 |
數據結構 | 高度結構化、復雜、適合操作計算 | 簡單、適合分析 |
數據使用頻率 | 高 | 低 |
數據訪問量 | 每個事務只訪問少量的記錄 | 有的事務可能需要訪問大量的記錄 |
響應要求 | 以秒為單位計算 | 分鐘、甚至小時為計算單位 |
2、數據倉庫的基本特性
面向主題:數據倉庫中數據是面向主題進行組織的,主題就是一個較高的管理層次上對信息系統中數據按照某一具體的管理對象進行歸類、綜合所形成的分析對象。比如企業中哪些產品暢銷、競爭對手哪些產品對本企業產品構成威脅。
數據是集成的:根據決策分析的要求,將分散于各處的原始數據進行抽取、篩選、清理、綜合等集成工作,數據倉庫的數據具有集成性。
一般情況下數據倉庫所需要的數據不需要直接從業務發生地獲取數據,而是針對原數據庫挑選中數據倉庫所需要的數據,然后將來自不同數據庫中的數據按照某一標準進行統一處理。
數據是相對穩定的:因為數據倉庫的數據主要是供決策分析使用,一般主要是數據查詢操作,不進行修改等操作。數據反映的是一段相當長的時間內歷史數據的內容,是不同時間的數據庫快照的集合,然后進行統計、綜合、分組的導出數據。
數據是反映歷史變化的:主要表現三個方面,數據倉庫隨時間變化不斷增加新的數據內容,定時獲取OLTP數據庫中變化的數據追加到數據倉庫中去;
隨時間變化不斷刪除舊的數據內容;數據倉庫中包含大量綜合數據會隔一段時間進行抽樣處理等。
3、數據倉庫的模式
主要有星型模式、雪花模式、事實星型模式。
4、數據倉庫的體系結構
底層:數據倉庫服務器。一般是關系數據庫系統,數據倉儲服務器從操作型數據庫或外部數據源提取數據對數據進行清理、轉換、集成等然后裝入數據倉庫中。
中間層:OLAP服務器。可以實現關系型OLAP提供多維數據的支持;也可以是多維的OLAP服務器,支持多維數據存儲存儲和操作。
頂層:前端工具。主要包括查詢、報表工具、分析工具、數據挖掘工具。
5、數據倉儲模型
5.1 企業倉庫
收集跨越整個企業的各個主題所有信息。提供全企業范圍的數據集成,數據通常來自多個操作型數據庫和外部信息的提供者,并且可以跨越多個功能范圍。
5.2 數據集市
包含對特定用戶有用的、企業范圍數據的一個子集。它的范圍限于選定的主題。
5.3 虛擬倉庫
虛擬倉庫是操作型數據庫上視圖的集合。為了有效地處理查詢,只有一些可能的匯總視圖被物化。虛擬倉庫易于建立,但需要操作型數據庫服務器具有剩余的能力。
?
IT技術分享社區
個人博客網站:https://programmerblog.xyz
文章推薦程序員效率:畫流程圖常用的工具程序員效率:整理常用的在線筆記軟件遠程辦公:常用的遠程協助軟件,你都知道嗎?51單片機程序下載、ISP及串口基礎知識硬件:斷路器、接觸器、繼電器基礎知識
?
?
?
?
?
?
?
?
?
?
?
?
?