Spearman 相關系數與 Pearson 相關系數的區別

核心區別對比表

特征Pearson 相關系數Spearman 相關系數
相關性類型線性相關單調相關
計算基礎原始數據值數據排名(秩)
公式$\rho = \frac{\text{cov}(X,Y)}{\sigma_X \sigma_Y}$$\rho = 1 - \frac{6\sum d_i^2}{n(n^2-1)}$
數據要求連續變量,近似正態分布有序數據或連續變量
異常值敏感性高度敏感不敏感
取值范圍[-1, 1][-1, 1]
單調關系檢測僅檢測線性關系檢測線性+非線性單調關系
計算復雜度較低較高(需計算排名)
適用場景線性關系,數據質量好非線性單調關系,異常值多,有序數據

詳細區別解析

1. 相關性類型不同

  • Pearson: 衡量變量之間的線性關系強度

  • Spearman: 衡量變量之間的單調關系強度(無論線性還是非線性)

2. 計算基礎不同

  • Pearson: 基于原始數據值的協方差和標準差

  • Spearman: 基于數據值的排名(秩)

    1. 將每個變量的值轉換為排名

    2. 計算排名之間的 Pearson 相關系數

4. 數據要求不同

  • Pearson:

    • 要求變量是連續型

    • 最好近似正態分布

    • 變量間關系應為線性

    • 無顯著異常值

  • Spearman:

    • 適用于連續變量和有序分類變量

    • 不要求正態分布

    • 可處理非線性但單調的關系

    • 對異常值穩健

5. 異常值敏感性

  • Pearson: 高度敏感,單個異常值可顯著改變結果

  • Spearman: 不敏感,因為使用排名而非原始值

6. 單調關系檢測

  • Pearson: 只能檢測線性關系

  • Spearman: 可檢測任何單調關系(線性或非線性)

  • Spearman: 可檢測任何單調關系(線性或非線性)

7. 計算示例對比

數據:

XY
11
24
39
416
525

Pearson 計算:

  • 計算原始數據的協方差和標準差

  • 結果 ≈ 0.96(顯示強相關)

Spearman 計算:

  1. 轉換為排名:

    X_rankY_rank
    11
    22
    33
    44
    55
  2. 計算排名間的 Pearson 相關

  3. 結果 = 1(完全單調相關)

8. 實際應用場景

使用 Pearson 當:

  • 數據滿足線性、正態分布假設

  • 需要精確測量線性關系強度

  • 數據質量高,無顯著異常值

  • 例如:身高與體重的關系研究

使用 Spearman 當:

  • 數據不滿足正態分布假設

  • 存在異常值

  • 變量是有序分類變量(如滿意度評分)

  • 關系可能是非線性但單調的

  • 例如:廣告投入與銷售額的關系(可能存在邊際效應遞減)

總結

  • Pearson?是"線性相關"的黃金標準,但對數據要求嚴格

  • Spearman?是更穩健的"單調相關"度量,適用范圍更廣

  • 在數據分析中,通常建議:

    1. 首先使用 Spearman(更穩健)

    2. 如果 Spearman 顯示強相關且數據質量好,再用 Pearson 測量線性強度

  • 兩種方法都是度量相關性而非因果性

  • 對于復雜關系,應結合散點圖等可視化工具分析

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/92097.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/92097.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/92097.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

sqli-labs靶場less36-less40

less361.我們打開靶場之后打開來看一下,輸入的內容會被轉義,依舊是寬字節注入2.使用以下寬字節注入,使用的是%df?id-1%df%27%20union%20select%201,database(),3--3.剩余內容與前面關卡基本一樣,只要使用上面的方法合成寬字節即可…

企業級 TinyMCE Vue 編輯器解決方案 – 配置優化與性能提升指南、自定義插件

## 簡介TinyMCE Vue 是官方提供的 TinyMCE 富文本編輯器的 Vue 組件封裝,支持 Vue 2 和 Vue 3。它讓你可以在 Vue 項目中快速集成強大的富文本編輯能力,支持多種插件、主題和自定義擴展,適用于博客、內容管理、后臺系統等多種場景。主要特性&…

【模電筆記】—— 直流穩壓電源——穩壓電路

Tips:本章節筆記建議讀者綜合學習,內容較多,可謂是模電相當重要的部分,因此部分知識點沒有做到詳細解釋。 1.穩壓電路的性能指標 (同上節直流穩壓電源的主要技術指標【模電筆記】—— 直流穩壓電源——整流、濾波電路…

C++——設計模式

文章目錄一、面向對象的優點和缺點1.1 回答重點1.2 擴展知識二、面向對象的三大特點2.1 回答重點2.2 擴展知識三、設計模式的六大原則3.1 回答重點3.1.1 單一職責原則(Single Responsibility Principle, SRP)3.1.2 開放 - 封閉原則(Open-Clos…

Android PDFBox 的使用指南

Android PDFBox 使用指南 概述 PDFBox是一個強大的PDF處理庫,在Android平臺上也有對應的實現。本指南將介紹如何在Android項目中使用PDFBox進行PDF文件的加載、讀取、修改等操作。 依賴配置 在 app/build.gradle 中添加PDFBox依賴: dependencies {i…

TFTP: Linux 系統安裝 TFTP,文件系統啟動后TFTP使用

安裝 TFTP 服務器 sudo apt update sudo apt install tftpd-hpa配置 TFTP 服務器 編輯配置文件 /etc/default/tftpd-hpa: sudo nano /etc/default/tftpd-hpa 修改內容如下: TFTP_USERNAME"tftp" TFTP_DIRECTORY"/srv/tftp" TFTP_ADD…

昇思+昇騰開發板+DeepSeek模型LoRA微調

昇思昇騰開發板DeepSeek模型LoRA微調 LoRA微調原理核心思想:凍結預訓練模型權重,僅訓練橙色的低秩適配矩陣(A/B矩陣)優勢: 訓練參數量減少至全量微調的0.5%顯存占用降低50%以上適配器權重僅需保存3MB(原模型…

計算機網絡:詳解網絡地址的計算步驟

網絡地址計算是網絡規劃與配置的基礎,核心是通過IP地址和子網掩碼確定網絡標識、廣播地址、可用主機范圍等關鍵信息。以下是詳細的計算步驟,配合實例說明(以IPv4為例): 一、明確基礎概念 在計算前,需先明確3個核心概念: IP地址:標識網絡中主機的32位二進制數,通常以…

Spring AI 系列之三十五 - Spring AI Alibaba-Graph框架之MCP

之前做個幾個大模型的應用,都是使用Python語言,后來有一個項目使用了Java,并使用了Spring AI框架。隨著Spring AI不斷地完善,最近它發布了1.0正式版,意味著它已經能很好的作為企業級生產環境的使用。對于Java開發者來說…

FastAPI后端工程化項目記錄

以下是一個使用fastapi上傳視頻的接口,記錄一下工程化后端程序的業務邏輯 重點是代碼如何抽離 項目結構優化 project/ ├── .env # 環境變量配置 ├── app/ │ ├── __init__.py │ ├── main.py # 主應用入口 │ …

令牌桶限流算法

你提供的 Java 代碼實現的是令牌桶限流算法(Token Bucket Algorithm),這是目前最常用、最靈活的限流算法之一。它允許一定程度的“突發流量”,同時又能控制平均速率。下面我將:逐行詳細解釋 TokenBucketLimiter 類的每…

基于springboot的寵物商城設計與實現

管理員:登錄,個人中心,用戶管埋,寵物分類管理,寵物信息管理,留言反饋,寵物論壇,系統管理,訂單管理用戶:寵物信息,寵物論壇,公告信息&a…

Python day36

浙大疏錦行 Python day36. 復習日 本周內容: 如何導入模塊以及庫項目的規范拆分和寫法官方文檔的閱讀MLP神經網絡的訓練在GPU上訓練模型可視化以及推理

【gaussian-splatting】用自己的數據復現高斯潑濺(一)

1.環境準備1.1.下載diff-gaussian-rasterization這里本來沒啥說的,直接從github上下載就行了,但是我踩坑了,下的版本不對,后續運行報錯參數個數對不上,特在此給大家避坑,注意一定要下帶3dgs版本的diff-gaus…

中國移動h10g-01_S905L處理器安卓7.1當貝純凈版線刷機包帶root權限_融合終端網關

下載固件之前請先將主板上的屏蔽罩取下,查看處理器型號 是否為S905L型號,然后再下載固件進行刷機; 本頁面的固件是采用雙公頭數據線進行刷機的哈; 安卓4.4.2版本固件下載地址:點此進行下載 安卓7.1版本固件下載地址…

夜天之書 #110 涓滴開源:Cronexpr 的故事

在年初的一篇關于商業開源的博文當中,我介紹了在開發商業軟件的過程中,衍生出開源公共軟件庫的模式。在那篇博文里面,我只是簡單羅列了相關開源庫的名字及一句話總結。近期,我會結合商業開源實踐的最新進展,對其中一些…

完整的登陸學生管理系統(配置數據庫)

目錄 要求 思路 1. 登錄模塊(LoginFrame.java) 2. 學生信息管理模塊(StudentFrame.java) 3. 數據層(StudentDAO.java) 4. 業務層(StudentService.java / UserService.java) 5…

譯 | 在 Python 中從頭開始構建 Qwen-3 MoE

文章出自:基于 2個Expert 的 MoE 架構分步指南 本篇適合 MoE 架構初學者。文章亮點在于詳細拆解 Qwen 3 MoE 架構,并用簡單代碼從零實現 MoE 路由器、RMSNorm 等核心組件,便于理解內部原理。 該方法適用于需部署高性能、高效率大模型&#x…

Spring Boot + ShardingSphere 分庫分表實戰

🚀Spring Boot ShardingSphere 實戰:分庫分表,性能暴增的終極指南! ? 適用場景:千萬級大表、高并發、讀寫分離場景 ? 核心框架:Spring Boot 3.x ShardingSphere-JDBC 5.4.1 ? 數據庫:MySQL…

MaxKB 使用 MCP 連接 Oracle (免安裝 cx_Oracle 和 Oracle Instant Client)

一、背景 安裝cx_Oracle包和Oracle Instant Client來操作數據庫,比較繁瑣同時容易沖突,不同的 Oracle 版本都需要安裝不同的插件。這篇文章將介紹使用 MCP 協議的連接方法。 二、操作步驟 1、使用 1Panel 安裝 DBhub a) 數據庫類型選擇 Oracle 類型。…