數據分析實戰2(Tableau)

1、Tableau功能

數據賦能(讓業務一線也可以輕松使用最新數據)

  • 分析師可以直接將數據看板發布到線上
  • 自動更新看板
  • 自由下載數據
  • 線上修改圖表
  • 郵箱發送數據
  • 設置數據預警

數據探索(通過統計分析和數據可視化,從數據發現問題,用數據驗證假設)

  • 支持億級數據的連接和處理
  • 自由地對字段進行各種計算
  • 拖拽就可以輕松制作圖表
  • 數據可以隨意聚合下鉆
  • 圖表類型可以靈活轉換
  • 內置算法智能建模

2、下載安裝

下載網址:https://www.tableau.com/zh-cn/products/public/download

3、數據連接

①連接類型

  • 本地文件
    • csv數據連接到文本
    • xls/xlsx連接到Excel
    • json直接連接到json
  • 數據庫
    • 下載數據庫對應的驅動后,填寫地址等參數連接到對應數據庫

②連接方式

  • 默認使用智能連接,只需選擇連接所用的數據字段即可
  • 連接所用的字段可以通過函數進行計算和編輯
  • 表格之間的連接原理
  • 課程操作?

③提取方式

  • 實時
    • 每次計算都會連接一次數據庫進行取數運算
    • 這是因為Tableau的本質是Vizql查詢語言,每做一個操作就查詢一次是可以實現的不過在數據量級較大的情況下就會比較慢了
  • 數據提取
    • 將當前連接所涉及的數據全部都查詢提取到hyper格式的數據提取(相當于Tableau自己的數據庫和對應類型的文件)
    • 如果保存為twbx格式,hyper會自動打包進twbx,使tableau自帶數據
    • 缺點是每次修改完數據源都要重新提取一遍數據,如果是實時,則不需要先提取,等你作圖時他才會再提取
    • 如果要將Tableau上傳到Sever服務器,則必須使用提取的數據連接方式
    • 其實大量級數據都要用數據提取,除了修改連接鍵,其他操作在工作表的視圖界面都能操作

④提取選項

  • 如果選擇數據提取,Tableau還支持對表格進行基于字段和函數的增量刷新,提升數據提取的性能,但百萬級以下的數據,除非頻繁提取,否則一般不需要這樣操作

⑤連接篩選

  • 可以在提取數據后進行預篩選,只保留篩選后的數據進行視圖操作保存類型
  • twb不包含數據
  • twbx內置數據到tableau的文件中點提取但是還沒保存時,tableau會讓你先保存提取的數據數據處理
  • 可以查看數據,進行排序、重命名、拆分等操作,這些操作在做圖界面也可以完成

⑥理解本次課程的數據

  • shop表有2385行
  • cpc表有1177行
  • orders表有4419行

4、數據可視化原理

人是可視化動物,看圖比看數據快

①2類型:

  • 度量:映射圖形
    • 可映射的圖形類型
      • 位置
      • 長度
      • 角度
      • 方向
      • 形狀
      • 面積和體積
      • 顏色和深淺
  • 維度:負責區分

②將數據變成圖表

  • 對【度量】和【維度】進行拖拽操作,從而完成可視化圖標的制作,是被稱作Tableau第一概念,是最重要的知識。(!!智能推薦不算作圖)
    • 行:縱坐標
    • 列:橫坐標

  • 離散形成標簽,連續形成數軸

③5個知識點總結

  • 度量默認聚合
  • 度量值會形成圖形標記,圖形標記可以切換
  • 維度會對度量值進行區分,增加度量值的信息密度(單個圖標傳達信息的多少)
  • 圖標分為有軸圖標和無軸圖表(極坐標圖表)
  • 離散形成標簽,連續形成數軸

④基礎圖標制作

堆積圖:

折線圖:

面積圖:

5、數據可視化原則、BI儀表盤搭建

(1)數據可視化原則

  • 區分用戶
  • 主次分明、詳略得當
    • 強調信息的方式有很多種,用恰當的方式去強調恰當的內容
  • 真實準確:數據要從0開始
  • 符合大眾的認知和審美
  • 適度原則
    • 顏色不超過8種
    • 排版、字體、大小、形狀等都要合適
    • 避免使用3d效果,容易產生錯覺
  • 五秒原則(5秒能看懂)
  • 恰到好處的說明(說明:標題、圖例、標注等)
  • 少即是多
  • 可視化案例

(2)BI儀表盤搭建

①儀表盤搭建原則

  • 符合業務的閱讀、思考、操作邏輯

②明確儀表盤主題

觀眾是誰,他們對什么感興趣

  • 普通業務人員(跟業務相關的數據)
    • 銷售:注冊—激活—成交
    • 投放:消耗—轉化率
    • 運維:搬車數—換電數
  • 中層管理者
    • 整體的總體報告
      • 業務整體的絕對值、達成率、同比環比;
      • 有哪些數據異常、優秀表現
    • 各個維度的數據
      • 各個業務動作的絕對值、達成率、同比環比
      • 數據異常的具體原因
  • 高層管理者
    • 整體的總結報告
      • 業務整體的絕對值、達成率、同比環比;
      • 有哪些數據異常、優秀表現
  • 用人單位
    • 有一個明確的分析主題
    • 分析維度越多越好
    • 圖標越高級越好

課程數據可發揮的主題

  • 每日營收情況
  • 無效訂單與配送距離的關系
  • 用戶下單時間分布
  • 用戶客單價變化
  • cpc投放效果

③儀表盤主題拆解

  • 怎樣的數據能表達清楚想說的主題?
    • 這個主題涉及到哪些數據?
    • 數據的重要程度是否相同?
    • 最適合數據的圖表是那種?
      • 對比
        • 絕對值對比——條形圖/柱狀圖
      • 變化
        • 沒有累計關系——折線圖+柱狀圖
        • 有累計關系——面積圖/堆積圖
      • 構成
        • 對象少于3個——環形圖
        • 對象大于3個——樹地圖
      • 分布
        • 單變量分布——直方圖
        • 多變量分布——散點圖、氣泡圖
  • 以每日營收情況主題為例
    • 關鍵數據
      • 營收數據
        • GMV
        • 商家實收
        • 用戶實付
        • 總訂單數
        • cpc總費用
        • 各平臺數據對比
      • 流量數據
        • 曝光人數
        • 進店人數
        • 下單人數
        • 進店轉化率
        • 下單轉化率
        • 新客數
        • 老客數
        • 復購率
    • 數據排序
      • 營收>投放>流量
    • 圖表選擇
      • 經營情況總覽:突出顯示的文字
      • 經營數據詳情:表格
      • 每日營收數據:多軸折線圖
      • 每日流量數據:雙軸組合圖
      • 新老客占比:環形圖
      • 平臺占比:環形圖
      • 門店排名:條形圖
      • 投放情況:散點圖

④開發設計工作表

  • 經營情況總覽:突出顯示的文字
  • 經營數據詳情:表格
  • 每日營收數據:多軸折線圖
  • 每日流量數據:雙軸組合圖
  • 新老客占比:環形圖
  • 平臺占比:環形圖
  • 門店排名:條形圖
  • 投放情況:散點圖

⑤構思儀表盤布局

⑥加“億點點”細節

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/84253.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/84253.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/84253.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

CentOS7_Linux下安裝Docker和docker-compose

目錄 環境要求安裝步驟1、修改鏡像源配置文件2、卸載舊版本 Docker(如有)3、安裝依賴工具4、添加 Docker 官方倉庫5、安裝 Docker 引擎6、啟動 Docker 并設置開機自啟7、驗證安裝8、配置鏡像加速器創建配置文件重啟 Docker 生效 9、允許非 root 用戶操作…

ubuntu中使用docker

上一篇我已經下載了一個ubuntu:20.04的鏡像; 1. 查看所有鏡像 sudo docker images 2. 基于本地存在的ubuntu:20.04鏡像創建一個容器,容器的名為cppubuntu-1。創建的時候就會啟動容器。 sudo docker run -itd --name cppubuntu-1 ubuntu:20.04 結果出…

均衡后的SNRSINR

本文主要摘自參考文獻中的前兩篇,相關文獻中經常會出現MIMO檢測后的SINR不過一直沒有找到相關數學推到過程,其中文獻[1]中給出了相關原理在此僅做記錄。 1. 系統模型 復信道模型 n t n_t nt? 根發送天線, n r n_r nr? 根接收天線的 MIMO 系…

佰力博科技與您探討熱釋電測量的幾種方法

熱釋電的測量主要涉及熱釋電系數的測定,這是表征熱釋電材料性能的重要參數。熱釋電系數的測量方法主要包括靜態法、動態法和積分電荷法。其中,積分電荷法最為常用,其原理是通過測量在電容器上積累的熱釋電電荷,從而確定熱釋電系數…

idea中 maven 本地倉庫有jar包,但還是找不到,解決打包失敗和無法引用的問題

1、刪除本地倉庫中的文件 進入本地倉庫對應jar包文件目錄中刪除_remote.repositories文件和結尾為.lastUpdated的文件 2、回到IDEA刷新Maven 3、查看之前引用不了的jar是否引入成功

ALOHA ACT算法與源碼筆記

算法 一文通透動作分塊算法ACT:斯坦福ALOHA團隊推出的動作序列預測算法(Action Chunking with Transformers) 比較簡單,算法題目里就寫了:Action Chunking with Transformers,比較有特色的地方就是Action Chunking,核…

數字ic后端設計從入門到精通6(含fusion compiler, tcl教學)repeater詳解

Repeaters RC延遲與導線長度的關系: 導線的電阻(R)和電容(C)都會隨著導線長度(l)的增加而增大。RC延遲是電阻和電容共同作用導致的信號延遲。由于RC延遲與R和C的乘積有關,因此它會隨…

Data Warebase 成功押注 PostgreSQL 生態,或成 AI 時代數據底座

本文內容整理自 ProtonBase CEO 王紹翾在 AICon 的主題演講《Data Warebase: Instant Ingest-Transform-Explore-Retrieve for AI Applications》。作者的職業經歷貫穿了 AI 1.0、2.0 和 3.0 的時代,從搜索推薦,到視覺 / 語音 / NLP 智能,再到…

【電力電子】基于STM32F103C8T6單片機雙極性SPWM逆變(硬件篇)

本項目是基于 STM32F103C8T6 微控制器的 SPWM(正弦脈寬調制)電源模塊,能夠生成可調頻率和幅值的正弦波交流電源輸出。該項目適用于逆變器、UPS電源、變頻器等應用場景。 供電電源 輸入電壓采集 上圖為本設計的電源電路,圖中 D1 為二極管, 其目的是防止正負極電源反接, …

Kubernetes (k8s)版本發布情況

Kubernetes (k8s)版本發布情況 代碼放在 GitHub - kubernetes/kubernetes: Production-Grade Container Scheduling and Management https://github.com/kubernetes/kubernetes/releases 文檔放在 kubernetes.io各個版本變更等: https://github.com/kubernetes/kubernet…

Python 接口:從協議到抽象基 類(Python使用register的方式)

Python使用register的方式 示例 11-14 把 Tombola.register 當作類裝飾器使用。在 Python 3.3 之 前的版本中不能這樣使用 register,必須在定義類之后像普通函數那 樣調用,如示例 11-14 中最后那行注釋所述。 雖然現在可以把 register 當作裝飾器使用了…

GRU 參數梯度推導與梯度消失分析

GRU 參數梯度推導與梯度消失分析 1. GRU 前向計算回顧 GRU 單元的核心計算步驟(忽略偏置項): 更新門: z_t σ(W_z [h_{t-1}, x_t]) 重置門: r_t σ(W_r [h_{t-1}, x_t]) 候選狀態: ?h_t tanh(W_h [r_t ⊙ h_{t-1}, x_t]) 新…

【字節擁抱開源】字節團隊開源視頻模型 ContentV: 有限算力下的視頻生成模型高效訓練

本項目提出了ContentV框架,通過三項關鍵創新高效加速基于DiT的視頻生成模型訓練: 極簡架構設計,最大化復用預訓練圖像生成模型進行視頻合成系統化的多階段訓練策略,利用流匹配技術提升效率經濟高效的人類反饋強化學習框架&#x…

分布式增量爬蟲實現方案

之前我們在討論的是分布式爬蟲如何實現增量爬取。增量爬蟲的目標是只爬取新產生或發生變化的頁面,避免重復抓取,以節省資源和時間。 在分布式環境下,增量爬蟲的實現需要考慮多個爬蟲節點之間的協調和去重。 另一種思路:將增量判…

單片機0-10V電壓輸出電路分享

一、原理圖 二、芯片介紹 GP8101是一個PWM信號轉模擬信號轉換器,相當于一個PWM信號輸入,模擬信號輸出的DAC。此 芯片可以將占空比為0%到100%的PWM信號線性轉換成0-5V或者0-10V的模擬電壓,并且輸出電壓 精度小于1%。GP8101M可以處理高頻調制的…

Spring AMQP

在現代分布式系統中,消息隊列是一種非常重要的通信機制,它能夠實現服務之間的異步通信、負載均衡以及解耦。Spring AMQP 是 Spring 框架對 AMQP(高級消息隊列協議)的支持,而 RabbitMQ 是 AMQP 協議的最流行實現之一。通…

第6章:Neo4j數據導入與導出

在實際應用中,數據的導入與導出是使用Neo4j的重要環節。無論是初始數據加載、系統遷移還是數據備份,都需要高效可靠的數據傳輸機制。本章將詳細介紹Neo4j中的各種數據導入與導出方法,幫助讀者掌握不同場景下的最佳實踐。 6.1 數據導入策略 …

RKNN開發環境搭建1-基于Ubuntu 18.04系統使用Docker安裝rknn-toolkit2

目錄 寫在最前面Docker 方式安裝rknn-toolkit2寫在最前面 瑞芯微在RKNN的環境搭建方面的資料很多,但是在搭建過程中發現很多問題教程中并未提及,對初學者不友好。所以博主做了這個系列的文章,從開始搭建環境到對于RKNN Model Zoo的示例進行實踐,希望能對初學者有幫助。堅持…

【實施指南】Android客戶端HTTPS雙向認證實施指南

🔐 一、所需準備材料 證書文件(6類核心文件) 類型 格式 作用 Android端要求 CA根證書 .crt/.pem 驗證服務器/客戶端證書合法性 需預置到Android信任庫 服務器證書 .crt 服務器身份證明 客戶端需持有以驗證服務器 客戶端證書 .crt 客戶端身份…

FPGA管腳類型,及選擇

fpga的IO Type選擇,如下: 具體的定義: