基于Excel的數據分析思維與分析方法

數據分析一定要會Excel、SQL和Python?非常肯定地回答您,Python、R語言、Excel函數和VBA,以及高級數據分析軟件,都學不到,您將學到:5個有效的數據分析利器,以及分析思維

一、描述性統計分析

在進行分析前,總需要有數據預處理,這里略。

1. 平均數、中位數

平均數和中位數通常結合來使用,主要用于觀察數據的分布情況。

  • 平均數>中位數:數據可能出現右偏(右長尾),即偏大的數據居多,拉高了整體均值。
  • 平均數<中位數:數據可能出現左偏(左長尾),即偏小的數據居多,拉低了整體均值。

2. 方差、標準差

方差,指數據的離散程度。方差和標準差可以將微小的變化顯著放大,即更直觀地觀察到業務的風險問題。

  • 大方差和標準差:指標波動大,業務穩定性低,經營風險高。
  • 小方差和標準差:指標波動小,業務穩定性高,經營風險低。

3. 分位數與異常值

通常使用IQR方法來檢測異常值,IQR = Q3 - Q1,Q為n分位數,箱線圖的上界:Q1 - 1.5 × IQR;箱線圖的下界:Q1 + 1.5 × IQR;超出箱體上界或下界的即認為是異常值。

4. 使用Excel進行描述性統計分析

文件 》選項 》在“加載項”中找到“分析工具庫” 》點擊轉到 》勾選“分析工具庫”,點擊確定
在這里插入圖片描述
在“數據”選項卡找到“數據分析”,并點擊,選擇“描述性統計”,并填寫相關信息
在這里插入圖片描述

在這里插入圖片描述

在這里插入圖片描述
然后就可以看到數據的描述性統計了
在這里插入圖片描述
而箱線圖可以使用插入圖表功能來繪制箱線圖,略。

二、變化分析

指標變化,說明業務環境發生了變化。變化包括上升、下跌、不變三種,無論是哪種變化,不能說明絕對好壞,如不變不一定是好事。意味著我們對指標的3種變化都要進行分析。

2.1 同比

本期數據與同期數據對比,主要是消除季節性或周期性變化的影響,而忽略周期間的變化。周同比、月同比、季度同比、年同比等。

計算方式:(數據A - 數據B)/ 數據B
例子:第3周周一的訪客數同比第1周周一增長了250%
適用場景:判斷是否比去年好

2.2 環比

環比,與相鄰時期(上一個時間段),主要是考察業務的連續波動情況,會被周期性波動影響。日環比、月環比、季度環比、年環比等。

計算方式:同上
例子:第二周周六周日的訪客數分別為120和150,則第二周周日環比增長25%
適用場景:判斷是否比上期好

2.3 使用Excel條件格式進行變化分析

除了使用公式計算環比和同比進行變化分析,也可以使用Excel的條件格式進行變化分析(包括數據條,色階,突出規則等)
在這里插入圖片描述

三、指標體系

3.1 指標

指標定義
MECE原則,即完全窮盡,相互獨立,無重復,無遺漏。

  • 非MECE分類:一個客戶可能既是老客戶又是 VIP,也可能既活躍又 VIP,互斥性不滿足,且可能遺漏新客戶。
  • MECE分類:新客戶、老客戶(又可以分為活躍老客戶、流失老客戶)

指標的特性:

  • 必須是數值,不能是文本、日期等字符
  • 必須是通過匯總得來的,即復合指標。(除不能再拆分的原子指標外)
  • 有清晰明確的業務含義的(強業務意義性)
  • 動態變化

指標絕不可以輕易更改!!!

理論上,北極星指標應該只有一個,清晰、可衡量,并能對齊整個組織的努力方向。但在實際操作中,不同團隊或子產品可以擁有自己的“局部北極星指標”作為支持性指標,構成完整的指標體系。

北極星指標、虛榮指標
北極星指標,又叫唯一關鍵指標(OMTM),是指在當前運營階段最重要的指標,目的是通過北極星指標專注和聚焦在當前階段最重要的問題上。

  • 一個故事理解北極星指標:早在Facebook之前,MySpace已是互聯網社交產品的領頭羊,對于MySpace,其戰略指標是“總注冊用戶數”,以表示MySpace的用戶規模。反觀Facebook,卻用“活躍用戶數”作為戰略指標。很明顯兩家社交平臺關注的戰略指標完全不一樣,一個是關注注冊用戶數,典型的規模類指標,很明顯MySpace是在追求用戶規模,對應的策略就是大量擴張新用戶;一個是關注活躍用戶數,典型的質量類指標,很明顯Facebook更關心用戶的質量,對應的策略就是從產品功能、運營策略上不斷去滿足用戶需求。因為關注的戰略指標不同,導致兩個公司截然不同的經營策略,最終結果大家均知,MySpace已不知去向,而Facebook成為互聯網社交大佬。

在產品運營中,與北極星指標相對應的是虛榮指標。北極星指標是當前產品階段戰略層面的指標,而虛榮指標是無法體現當前階段戰略方向的,僅僅是數字上很漂亮的指標,故謂之虛榮指標。最著名的虛榮指標就是累計注冊用戶數。虛榮指標有一個特別有趣的特性:只增不減

北極星指標并非固定不變!!!產品本身是有生命周期的,在不同的生命周期產品承擔的使命也不同,在誕生期的產品,其核心目的是迅速擴大用戶規模,盡快占有市場,以取得先發優勢;在發展期的產品,其核心目的是提升用戶質量,盡可能黏住用戶并完成營收轉化。所以在產品的不同生命周期,其產品特性、商業模式和經營策略都不盡相同。

3.2 維度

維度概念:維度是描述指標的不同角度,如地理維度(其中包括國家、地
區、省以及城市等級別的內容)、時間維度(其中包括年、季、月、
周、日等級別的內容),維度既可以是文本也可以是數值。
維度操作:

  • 維度上卷:維度上卷是從明細數據到匯總數據進行分析的過程。例如在分析用戶地區的銷售額時,首先分析的是城市維度的銷售額,然后逐步匯總到省份的銷售額。通過維度上卷,可以從整體了解數據變化的影響程度,做出正確的決策。在這里插入圖片描述

  • 維度下鉆:維度下鉆是從匯總計算的數據逐步拆解到明細數據的分析過程。例如在分析用戶地區的銷售額時,首先分析的是省份維度的銷售額,然后逐步細分到城市的銷售額。

在這里插入圖片描述

3.3 如何用“指標體系”來分析指標變化的原因

尋找指標變化原因時,通常采用多維度分析方法,多維分析包括如
下兩個層面:

3.3.1 基于指標的業務口徑來尋找原因(規模)
例如,電商的收入規模類指標GMV,即成交金額,其標準業務口徑包含已付款和拍下未付款兩部分。當GMV發生變化時,按照指標的業務口徑分析,即分析已付款和拍下未付款的變化分別是什么,可以分為以下幾種情況:

  1. GMV上漲,已付款上漲,拍下未付款上漲。
  2. GMV上漲,已付款上漲,拍下未付款下降或不變。
  3. GMV上漲,已付款下降或不變,拍下未付款上漲。
  4. GMV下跌 … 等

然后再去尋找已付款由哪些部分組成,或拍下未付款由哪些部分
組成,追蹤這兩個指標的業務口徑,繼續排查原因。

3.3.2 基于指標關聯的維度來尋找原因(即指標的構成角度)
例如,產品的DAU(每日活躍用戶),按照指標的維度來分析,標準分析過程是按照新客、老客、沉默喚醒、流失召回四大客群的DAU分別進行分析,來尋找產品整體DAU的變化原因。整體DAU=新客DAU+老客DAU+沉默喚醒DAU。繼續細分,排查原因。

四、相關性分析

4.1 定義

相關性分析,指對兩個或多個指標進行分析,評估它們兩兩之間聯系或相互影響的程度。相關性分析的應用范圍非常廣,除了互聯網產品,傳統行業和線下業務也可以用,原因在于相關性分析支持幾乎所有的業務指標類型,包括連續型指標和離散型指標。離散型指標又分為二分類型、無序型、有序型。

!!!切記:相關性 ≠ 因果,相關性是指一個變量變化的同時,另一個變量也會伴隨發生變化,但不能確定一個變量變化是不是另一個變量變化的原因。因果關系,是指一個變量的存在一定會導致另一個變量的產生。

4.2 相關性分析的3種算法

相關性分析的2個前提條件:無異常值、指標間務必相互獨立,互不影響。

4.2.1 連續型指標 vs 連續型指標:皮爾遜相關系數(Pearson)
Pearson的前提條件:

  • 指標服從正態分布
  • 兩個指標的數據要一一對應,成對出現
  • 無異常值

說明: Pearson 相關系數 𝑟 衡量的是樣本中兩個變量之間的線性相關強度,但它僅僅是樣本估計值,不能直接推斷總體的關系是否顯著,因此需要顯著性檢驗(假設檢驗,通常使用t檢驗)來確認相關性是否可信。

4.2.2 有序離散型指標 vs 有序離散型指標:斯皮爾曼等級相關系數(Spearman)或肯德爾秩相關系數(Kendall)
前提條件:

  • 指標不服從正態分布
  • 兩個指標的數據要一一對應,成對出現
  • 無異常值

4.2.3 無序離散型指標和連續型指標的相關性算法:對不起,無相關性

指標 A指標 B相關性算法應用示例
連續型連續型Pearson藥品曝光量和購買轉化率
有序離散型有序離散型Spearman、Kendall用戶等級和活躍度
無序離散型無序離散型卡方檢驗、Fisher 檢驗手機品牌和年齡段
二分類目標連續型Point-biserial性別和閱讀率
二分類目標有序離散型Biserial性別和滿意度評分
有序離散型連續型無直接算法,建議轉換后處理商品評分和購買轉化率

4.3 在Excel中進行“相關性分析”

4.3.1 如何尋找對購買轉化率貢獻最大的渠道
目標:評估哪些渠道的用戶對整體購買轉化率貢獻最大。
過程:

  • “數據”選項卡找到“數據分析”,選擇相關系數(只有默認的Pearson系數)進行相關性分析在這里插入圖片描述
    在這里插入圖片描述

  • 相關性分析結果:渠道B購買轉化率與整體的最相關,因此,需要重點關注發展渠道B的業務。

在這里插入圖片描述

五、趨勢預測

預測分析是典型的數據挖掘應用,通過分析序列進行合理預測,做到提前掌握未來發展趨勢,為業務經營決策提供依據。大數據有4個特性,即4V:Volume(大量),Velocity(高速),Variety(多樣)和Value(價值)。
可以“趨勢預測”是因為:

  • 足夠大的樣本量和足夠豐富的樣本維度。
  • 考察概率而不是準確率!!!。置信度、置信區間、可能性的字眼,它們都是在說明分析的結果有多少可信度,而不是有多少準確性。
  • 相關而非因果。影響指標變化的因素也是多維的,實際業務經營中尋找原因遠比尋找相關因素要困難得多。

5.1 基于時間序列的趨勢預測

時間序列預測,認為指標的歷史數據是有一定延續性的,即歷史上指標的趨勢在未來也會大概率延續,同時接受一定程度的指標波動,認為是合理的隨機事件,并把這種波動也考慮到未來走勢中,所以時間序列預測輸出的趨勢以及波動性,是和歷史數據的趨勢與波動性大概率高度一致的。因此,時間序列預測屬于定量分析,也叫方向性分析,是找出未來可能的走勢方向,其輸出的趨勢值僅供參考。

5.2 基于回歸分析的趨勢預測

回歸分析,是指定量分析兩種或兩種以上指標間相互依賴關系的分析方法。回歸分析支持兩個或多個指標間的關系。

5.3 在Excel中實現時間序列趨勢預測

在Excel中,能夠實現時間序列預測的叫預測工作表,這個工作表在“數據”選項卡。
操作流程:

  1. 檢查數據是否符合要求。要求數據為兩列,第一列必須是時間序列,且間隔均勻,即必須是連續、等差的時間數據,不能出現缺漏的情況。

  2. 選中所有數據,點擊“數據”選項卡,找到并點擊“預測工作表”,彈出時間序列配置窗口。
    在這里插入圖片描述

  3. 通常Excel會自動分析數據的季節性和周期性,并輸出預測線。檢查各項配置無誤后,單擊“確定”按鈕即可。

5.4 在Excel中實現回歸分析趨勢預測

在Excel中,能夠實現回歸分析的叫趨勢線,是圖表的附屬功能。
操作步驟:

  1. 選中所有數據,點擊“插入”選項卡,選擇柱狀圖
  2. 在柱狀圖的數據柱上單擊右鍵,找到“添加趨勢線”,點擊“添加趨勢線”,彈出趨勢線配置窗口
  3. 勾選“顯示R平方值”,切換不同的回歸算法,選擇R2接近于1的算法(一般情況下用線性或指數,其他算法較少使用)
  4. 在趨勢線配置窗口找到“向前”,輸入預測周期
    在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/87819.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/87819.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/87819.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

計算機網絡筆記(不全)

一、計算機網絡體系結構1.計算機網絡的概念計算機網絡&#xff1a;由若干結點和連接這些結點的鏈路組成。結點可以是計算機、集線器、交換機、路由器等。互連網(internet)&#xff1a;多個計算機網絡通過路由器互相連接而成&#xff0c;可用任意協議通信。互聯網(因特網Interne…

XML Schema 復合元素

XML Schema 復合元素 引言 XML(可擴展標記語言)作為一種靈活的標記語言,廣泛應用于數據交換和存儲。XML Schema 是一種用于描述和定義 XML 文檔結構的語言,它定義了 XML 文檔的元素、屬性、類型和約束。本文將詳細介紹 XML Schema 中的復合元素,并探討其在實際應用中的重…

華為云Flexus+DeepSeek征文 | 彈性算力實戰:Flexus X實例自動擴縮容策略優化

華為云FlexusDeepSeek征文 | 彈性算力實戰&#xff1a;Flexus X實例自動擴縮容策略優化 &#x1f31f; 嗨&#xff0c;我是IRpickstars&#xff01; &#x1f30c; 總有一行代碼&#xff0c;能點亮萬千星辰。 &#x1f50d; 在技術的宇宙中&#xff0c;我愿做永不停歇的探索者…

【倉頡】運行環境配置VSCode + Win11

作者&#xff1a;大李子 團隊&#xff1a;堅果派 十年iOS&#xff0c;All in轉鴻蒙 前言 “倉頡編程語言是一款面向全場景智能的新一代編程語言&#xff0c;主打原生智能化、天生全場景、高性能、強安全。融入鴻蒙生態&#xff0c;為開發者提供良好的編程體驗。” ——摘自倉…

【K線訓練軟件研發歷程】【日常記錄向】1.K線滑動窗口

文章目錄 當前效果未來發展思路技術選型值得分享的技術點數據加載、解析的代碼echats的代碼當前效果 ??相當于有個hello world了。 未來發展思路 開源 技術選型 界面直接采用electron,等開源后,可以直接掛release,用戶下載安裝包后,一鍵安裝,一鍵運行,降低使用門檻…

抖音解析下載工具 v1.0.0:免安裝單文件,一鍵無水印保存高清視音頻

寶子們&#xff0c;今天給你們帶來一款超輕量的抖音下載神器——抖音解析下載工具 v1.0.0。 它只有單文件&#xff0c;雙擊就能用&#xff0c;免安裝、無廣告、完全免費&#xff0c;復制粘貼鏈接即可一鍵解析下載高清無水印視頻/音頻&#xff0c;簡直不要太方便&#xff01; 為…

Ingress——2

目錄 ?一. 域名重定向&#xff08;HTTP→HTTPS/舊域名跳轉&#xff09;? ?二. 前后端分離Rewrite&#xff08;路徑改寫&#xff09;? ?三. 混合配置示例&#xff08;重定向Rewrite&#xff09;? ?四. SSL/TLS配置&#xff08;HTTPS加密&#xff09;? ?五. 基本認…

12. grafana-Dashboard的Variable(過濾)使用

說明制作這樣一個選擇過濾的下拉框&#xff0c;可以選擇某個服務器的步驟1. 點擊最上面的Dashboard settings2. 選擇Variables 并點擊ADD variable3. 寫出過濾的標簽名和查詢條件&#xff08;label_values(查詢條件)&#xff09;4. 點擊 save as... 保存退出5. 出來后左上角就…

Cursor一鍵續杯pro教程,支持最新1.0系列版本

使用前檢查&#xff1a; 使用前請先看左下角&#xff0c;是否獲取到Cursor的版本號 如果沒有請先在 功能頁面 -→ 自定義Cursor路徑 選擇你Cursor的安裝的路徑&#xff0c;并開啟后重啟YCursor&#xff0c;獲取到版本后才能正常使用功能 檢查軟件左下角的權限標識是否為綠色 如…

pyhton基礎【25】面向對象進階六

目錄 十七.單例模式 實現單例模式的兩種方式 __new__方法概述 單例模式的使用場景 十七.單例模式 引入 單例模式是一種常用的軟件設計模式&#xff0c;它確保一個類只有一個實例&#xff0c;并提供一個全局訪問點來獲取這個實例。 實現單例模式的兩種方式 使用類屬性創…

后端樹形結構

案例 在后端開發中&#xff0c;樹形結構數據的查詢和處理是一個常見的需求&#xff0c;比如部門管理、分類目錄展示等場景。接下來&#xff0c;我們以一個部門管理系統為例&#xff0c;詳細介紹如何實現后端的樹查詢功能。 案例背景 假設我們正在開發一個公司的內部管理系統&am…

高效溝通04-RIDE說服模型

高效溝通專欄–組織運轉的命脈與個人成功的基石 目錄 1. RIDE模型的核心理念2. RIDE模型的應用場景3. RIDE模型使用步驟4. RIDE模型示例與練習4.1 應用RIDE模型:4.2 練習:你來試試!5. 總結RIDE模型是一種結構化的說服框架,旨在幫助你在溝通(尤其是書面溝通或需要清晰邏輯…

利用selenium獲取網頁數據,腳本加載慢問題的解決辦法

問題&#xff1a;最近在寫一個腳本去獲取一個網站的數據&#xff0c;用到一個表格中的數據&#xff0c;條目是1000條&#xff0c;需要逐條去獲取網站上對應的數據&#xff0c;遇到的問題是腳本運行后&#xff0c;很久才開始打開驅動瀏覽器。經過很多次嘗試&#xff0c;主要原因…

Ubuntu查看本機代理的實操指南

快速確認代理狀態的必要性在Ubuntu系統中&#xff0c;代理設置是跨境訪問、企業內網連接、開發調試的重要配置。無論是排查網絡卡頓、驗證代理是否生效&#xff0c;還是確保特定應用走代理通道&#xff0c;快速查看當前代理狀態都是關鍵步驟。圖形界面查看&#xff0c;可視化操…

三格電子——雙通道 CAN(FD)轉以太網

【SG-CAN(FD)NET-210】 一、功能描述 CANFD 完全向下兼容 CAN &#xff0c;以下統稱 CAN(FD) 。 SG-CAN(FD)NET-210 是一款用來把 CANFD 總線數據轉為網口數據的設 備。 網口支持 TCP Sever 、 TCP Client 、 UDP Sever 、 UDP Client 四種模式。 可以通過軟件配置…

【一起來學AI大模型】卷積神經網絡(CNN):視覺識別的革命性架構

一、CNN的核心思想與生物啟示 卷積神經網絡&#xff08;Convolutional Neural Networks&#xff09;是受生物視覺皮層啟發的深度學習架構&#xff0c;專門用于處理網格狀拓撲數據&#xff08;如圖像、視頻、音頻&#xff09;。其核心創新在于&#xff1a; 局部感受野&#xff…

創建和編輯Crontab的方法

計劃任務&#xff0c;在 Linux 中一般使用Crontab&#xff0c;通過crontab命令&#xff0c;我們可以在固定的間隔時間執行指定的系統指令或 Shell 腳本。時間間隔的單位可以是分鐘、小時、日、月、周及以上的任意組合。這個命令非常適合周期性的日志分析或數據備份等工作。 創建…

在職場中如何培養創新思維?

芯片研發人員&#xff0c;授權發明專利40&#xff0c;聊聊技術層面的創新&#xff0c; 創新的本質&#xff0c;是舊有知識的創造性組合&#xff0c; 不存在無中生有的創新&#xff0c; 你必須建立本領域的知識體系&#xff0c;對過往各種創新&#xff0c;爛熟于心&#xff0…

設備健康管理平臺功能深度對比:中訊燭龍如何以預測性維護重構工業運維范式?

全球制造業因非計劃停機每年損失超千億美元?&#xff0c;而搭載預測性維護系統的企業&#xff0c;設備可用率可提升至99.8%??。 在工業4.0與智能制造浪潮下&#xff0c;設備健康管理平臺已從“可選工具”升級為“核心生產力工具”。面對市場上功能繁雜的解決方案&#xff0c…

YOLOv11 架構優化:提升目標檢測性能

YOLOv11 作為目標檢測領域的最新成果&#xff0c;其架構優化是提升性能的關鍵。本文將詳細探討 YOLOv11 的架構改進&#xff0c;以及這些改進如何幫助模型在實時應用中實現更高的準確性和效率。 一、架構改進 &#xff08;一&#xff09;C3K2 塊 C3K2 塊是對 CSP 塊的增強&a…