指標爆炸這個詞大家可能都是第一次聽說,指標怎么會爆炸呢?其實這個是我們很多年前在一些商業智能BI項目上總結出來的一種場景或者現象,就是過于的開放給業務人員在BI自助分析過程中創造了很多衍生性的分析指標,結果就造成了前端指標過于臃腫的局面。
什么是指標爆炸
簡單來說,指標爆炸具體的表現主要是:
第一,每個人都有能力自己造指標,造成指標的定義在不同的部門或者業務領域出現重復,但實際指標的含義相差甚遠。比如名稱叫的一樣,但是業務計算公式可能不相同,在可視化頁面上大家可能看到的名稱一樣,但解釋口徑完全不同,指標相互打架。
第二,造了很多臨時性的分析指標,指標越來越多,缺乏統一管理,復用度很低,指標像爆炸了一樣,越到后期越難管理。
第三,隨著業務的變化和調整,指標的業務計算規則可能在一個新的業務周期它的業務邏輯已經發生更改,于是業務人員在前端對指標的一些計算邏輯、聚合規則做了改變,但是這種改變是以直接覆蓋的形式,即早期的數據應該保留早期計算規則的但并沒有保留,就形成了在一些歷史數據在呈現的時候不正確,因為用了新的計算規則來計算。
數據可視化 - 派可數據商業智能BI可視化分析平臺
這上面的三種情況隨著商業智能BI的應用面越深、越廣就越來越混亂,所以我們把這種場景就叫做指標爆炸。
這種場景一般的公司可能基本上碰不到指標爆炸,為什么?這些公司對商業智能BI的應用能力還沒有真正達到讓業務人員能夠完全自助的參與到可視化分析、可視化報表的設計上。只有對商業智能BI應用比較深的,業務人員參與越多的、對業務人員開放性更大的企業才會出現這種問題。
指標爆炸分析
這個問題我們之前碰到過,基本上一碰到苗頭就打下去了,但也要去做出一些平衡。有兩個關鍵的點:第一,就是IT和業務在商業智能BI上的邊界是什么?第二,指標應該如何統一來管理,如何在自助和規范上做到平衡。自助就意味著能力的開放,規范就是往回拉,要控制。
先來說下第一個點,IT和業務在商業智能BI上的邊界是什么?這個大家要結合之前發過的文章視頻《BI的后端建模和前端建模有什么區別和聯系》,去了解下前后端建模。簡單來說IT和業務的邊界就在于數據倉庫這個層面,從底層業務系統數據源到數據倉庫的數據打通、ETL開放、建模等等這些都是IT的活,BI開發人員的活。
數據倉庫 - 派可數據商業智能BI可視化分析平臺
在數據倉庫這個層面對業務人員、前端的BI可視化分析工具開放數據集市層即Data Mart,業務人員日常用到的維度或者事實表指標都在這個層上,通過權限控制讓不同的業務人員訪問不同的分析模型,這樣通過前端建模也可以自助的做各種各樣的自助分析,這個問題是可以解決的。
其次,原則上不允許前端業務人員在做商業智能BI分析的時候自己創建新的指標,對于分析指標有一套完整的管理機制,從指標的定義、業務規則的審核、開發、發布和培訓有一套完整的流程。
每一個指標都有一個Owner 所有者,避免指標的定義發生歧義,指標的業務規則只能有一套口徑,這些指標 定義好了,IT、BI開發人員來開發,開發好了更新到某一個分析模型中或者發布一個新的模型,給業務人員做好分析場景的演示和培訓,告訴大家怎么用。
如果業務人員就是想自己造一個指標來用,那這個指標一定是臨時性的,就自己在自己的私有報表頁面上用,不允許發布到對外的正式可視化頁面當中。如果這個指標經過驗證,并且得到一致的認同,可以按照之前的管理流程走一遍。這個時候可以通知IT部門BI團隊將這個臨時性的指標維護到正式的商業智能BI數據倉庫中,這樣就形成了指標的統一管理,指標也得到了高度可復用、沉淀下來,并且一定是一套統一的口徑。
指標管理 - 派可數據商業智能BI可視化分析平臺
這種方式就可以解決很多問題,既可以保證指標的統一管理、公共指標下沉、指標的復用性,又可以避免業務人員自造指標出現指標爆炸的問題。包括像前面講到的指標場景,由于業務邏輯發生變更的情況下,需要維護兩套或者多套的業務計算規則,這個問題在底層數據倉庫上就很容易維護進去,對于業務人員在前端根本就不用關心這些事情了。
這種方法論可以支撐非常大體系的商業智能BI項目,我們之前在一個項目上就涉及到了幾百個業務用戶,幾千張分析報表,業務人員自助做的可視化頁面就達到了兩千多張,靠的就是這種方式,是已經驗證過的非常成功的一種方式。
指標爆炸問題核心
大家注意到沒有,解決指標爆炸的核心是什么?第一就是后端建模、完整的數據倉庫底座作為基礎,沒有底層的數據倉庫構建,是不可能解決這類問題的,這個結論我就在這里直接告訴給大家。
指標管理 - 派可數據商業智能BI可視化分析平臺
第一不管你是傳統的基于關系型的數據倉庫建模,還是基于大數據架構的數據倉庫建模,都是數據倉庫建模。第二就是一套完整的關于指標的管理機制,沒有這種機制去管理、去控制和平衡IT和業務的邊界,對于指標的管理一定會失控,只是會在第一年失控還是在第二年、第三年失控。
規矩往往是最開始定下來比較好,等到真正出現指標失控、指標爆炸的情況再去解決,基本上就已經喪失最好的時機了。客戶就會覺得你很不專業,后面要投入這么大的精力、時間來解決這個問題,你到底有沒有大項目的規劃和建設經驗呢?這些問題為什么不一開始就告訴我們呢?當這些事情發生的時候就會很被動。