數據分析是基于商業目的,有目的地進行收集、整理、加工和分析數據,提煉出有價值的 信息的一個過程。整個過程大致可分為五個階段,具體如下圖所示。
1.明確目的和思路
在開展數據分析之前,我們必須要搞清楚幾個問題,比如數據對象是誰?要解決什么業務問題?并基于對項目的理解,整理出分析的框架和思路。例如,減少新客戶的流失、優化活動效果、提高客戶響應率等。不同的項目對數據的要求是不一樣的,使用的分析手段也是不一樣的。
2.數據收集
數據收集是按照確定的數據分析思路和框架內容,有目的地收集、整合相關數據的一個過程、它是數據分析的基礎。
3.數據處理
數據處理是指對收集到的數據進行清洗、加工、整理等一些操作,以便開展數據分析,它 是數據分析前必不可少的階段。這個階段是數據分析整個過程中最耗時的,也在一定程度上保 證了數據的質量。
4.數據分析
數據分析是指通過分析手段、方法和技巧對準備好的數據進行探索、分析,從中發現因果關系、內部聯系和業務規劃,為商業決策提供參考。
到了這個階段,要想駕馭數據開展數據分析,就要涉及工具和方法的使用,其一是要熟悉 常規數據分析方法及原理,其二是要熟悉專業數據分析工具的使用,比如pandas、MATLAB等, 以便進行一些專業的數據統計、數據建模等。
5.數據展現
俗話說:字不如表,表不如圖。通常情況下,數據分析的結果都會通過圖表方式進行展現,常用的圖表包括餅圖、折線圖、條形圖、散點圖等。借助圖表展現數據的方式,可以更加直觀 ?地呈現信息、觀點和建議。