1、Tableau功能
數據賦能(讓業務一線也可以輕松使用最新數據)
- 分析師可以直接將數據看板發布到線上
- 自動更新看板
- 自由下載數據
- 線上修改圖表
- 郵箱發送數據
- 設置數據預警
數據探索(通過統計分析和數據可視化,從數據發現問題,用數據驗證假設)
- 支持億級數據的連接和處理
- 自由地對字段進行各種計算
- 拖拽就可以輕松制作圖表
- 數據可以隨意聚合下鉆
- 圖表類型可以靈活轉換
- 內置算法智能建模
2、下載安裝
下載網址:https://www.tableau.com/zh-cn/products/public/download
3、數據連接
①連接類型
- 本地文件
- csv數據連接到文本
- xls/xlsx連接到Excel
- json直接連接到json
- 數據庫
- 下載數據庫對應的驅動后,填寫地址等參數連接到對應數據庫
②連接方式
- 默認使用智能連接,只需選擇連接所用的數據字段即可
- 連接所用的字段可以通過函數進行計算和編輯
- 表格之間的連接原理
- 課程操作?
③提取方式
- 實時
- 每次計算都會連接一次數據庫進行取數運算
- 這是因為Tableau的本質是Vizql查詢語言,每做一個操作就查詢一次是可以實現的不過在數據量級較大的情況下就會比較慢了
- 數據提取
- 將當前連接所涉及的數據全部都查詢提取到hyper格式的數據提取(相當于Tableau自己的數據庫和對應類型的文件)
- 如果保存為twbx格式,hyper會自動打包進twbx,使tableau自帶數據
- 缺點是每次修改完數據源都要重新提取一遍數據,如果是實時,則不需要先提取,等你作圖時他才會再提取
- 如果要將Tableau上傳到Sever服務器,則必須使用提取的數據連接方式
- 其實大量級數據都要用數據提取,除了修改連接鍵,其他操作在工作表的視圖界面都能操作
④提取選項
- 如果選擇數據提取,Tableau還支持對表格進行基于字段和函數的增量刷新,提升數據提取的性能,但百萬級以下的數據,除非頻繁提取,否則一般不需要這樣操作
⑤連接篩選
- 可以在提取數據后進行預篩選,只保留篩選后的數據進行視圖操作保存類型
- twb不包含數據
- twbx內置數據到tableau的文件中點提取但是還沒保存時,tableau會讓你先保存提取的數據數據處理
- 可以查看數據,進行排序、重命名、拆分等操作,這些操作在做圖界面也可以完成
⑥理解本次課程的數據
- shop表有2385行
- cpc表有1177行
- orders表有4419行
4、數據可視化原理
人是可視化動物,看圖比看數據快
①2類型:
- 度量:映射圖形
- 可映射的圖形類型
- 位置
- 長度
- 角度
- 方向
- 形狀
- 面積和體積
- 顏色和深淺
- 可映射的圖形類型
- 維度:負責區分
②將數據變成圖表
- 對【度量】和【維度】進行拖拽操作,從而完成可視化圖標的制作,是被稱作Tableau第一概念,是最重要的知識。(!!智能推薦不算作圖)
- 行:縱坐標
- 列:橫坐標
- 離散形成標簽,連續形成數軸
③5個知識點總結
- 度量默認聚合
- 度量值會形成圖形標記,圖形標記可以切換
- 維度會對度量值進行區分,增加度量值的信息密度(單個圖標傳達信息的多少)
- 圖標分為有軸圖標和無軸圖表(極坐標圖表)
- 離散形成標簽,連續形成數軸
④基礎圖標制作
堆積圖:
折線圖:
面積圖:
5、數據可視化原則、BI儀表盤搭建
(1)數據可視化原則
- 區分用戶
- 主次分明、詳略得當
- 強調信息的方式有很多種,用恰當的方式去強調恰當的內容
- 真實準確:數據要從0開始
- 符合大眾的認知和審美
- 適度原則
- 顏色不超過8種
- 排版、字體、大小、形狀等都要合適
- 避免使用3d效果,容易產生錯覺
- 五秒原則(5秒能看懂)
- 恰到好處的說明(說明:標題、圖例、標注等)
- 少即是多
- 可視化案例
(2)BI儀表盤搭建
①儀表盤搭建原則
- 符合業務的閱讀、思考、操作邏輯
②明確儀表盤主題
觀眾是誰,他們對什么感興趣
- 普通業務人員(跟業務相關的數據)
- 銷售:注冊—激活—成交
- 投放:消耗—轉化率
- 運維:搬車數—換電數
- 中層管理者
- 整體的總體報告
- 業務整體的絕對值、達成率、同比環比;
- 有哪些數據異常、優秀表現
- 各個維度的數據
- 各個業務動作的絕對值、達成率、同比環比
- 數據異常的具體原因
- 整體的總體報告
- 高層管理者
- 整體的總結報告
- 業務整體的絕對值、達成率、同比環比;
- 有哪些數據異常、優秀表現
- 整體的總結報告
- 用人單位
- 有一個明確的分析主題
- 分析維度越多越好
- 圖標越高級越好
課程數據可發揮的主題
- 每日營收情況
- 無效訂單與配送距離的關系
- 用戶下單時間分布
- 用戶客單價變化
- cpc投放效果
③儀表盤主題拆解
- 怎樣的數據能表達清楚想說的主題?
- 這個主題涉及到哪些數據?
- 數據的重要程度是否相同?
- 最適合數據的圖表是那種?
- 對比
- 絕對值對比——條形圖/柱狀圖
- 變化
- 沒有累計關系——折線圖+柱狀圖
- 有累計關系——面積圖/堆積圖
- 構成
- 對象少于3個——環形圖
- 對象大于3個——樹地圖
- 分布
- 單變量分布——直方圖
- 多變量分布——散點圖、氣泡圖
- 對比
- 以每日營收情況主題為例
- 關鍵數據
- 營收數據
- GMV
- 商家實收
- 用戶實付
- 總訂單數
- cpc總費用
- 各平臺數據對比
- 流量數據
- 曝光人數
- 進店人數
- 下單人數
- 進店轉化率
- 下單轉化率
- 新客數
- 老客數
- 復購率
- 營收數據
- 數據排序
- 營收>投放>流量
- 圖表選擇
- 經營情況總覽:突出顯示的文字
- 經營數據詳情:表格
- 每日營收數據:多軸折線圖
- 每日流量數據:雙軸組合圖
- 新老客占比:環形圖
- 平臺占比:環形圖
- 門店排名:條形圖
- 投放情況:散點圖
- 關鍵數據
④開發設計工作表
- 經營情況總覽:突出顯示的文字
- 經營數據詳情:表格
- 每日營收數據:多軸折線圖
- 每日流量數據:雙軸組合圖
- 新老客占比:環形圖
- 平臺占比:環形圖
- 門店排名:條形圖
- 投放情況:散點圖
⑤構思儀表盤布局
⑥加“億點點”細節