從0開始學習R語言--Day39--Spearman 秩相關

在非參數統計中,不看數據的實際數值,單純比較兩組變量的值的排名是通用的基本方法,但在客觀數據中,很多變量的關系都是非線性的,其他的方法不是對樣本數據的大小和線性有要求,就是只能對比數據的差異性,而不能展示這種非線性的單調性,比如想知道練習時間與游戲段位的關系,雖然從結果上看是正相關,但在過程中的體現可能是進步速度非常快后趨于穩定,其他的函數方法會漏掉這種細節。

以下是一個例子:

set.seed(123)
# 生成數據:學習時間增加,成績總體上升但非線性
Hours <- sort(runif(50, 1, 10))  # 1到10小時,均勻分布
Score <- 50 + 10 * sqrt(Hours) + rnorm(50, 0, 5)  # 非線性關系+噪聲# 構建數據框
df <- data.frame(Hours, Score)
head(df)# 方法1:直接使用cor.test()
result <- cor.test(df$Hours, df$Score, method = "spearman")
print(result)# 方法2:手動計算(驗證原理)
rank_Hours <- rank(df$Hours)
rank_Score <- rank(df$Score)
n <- nrow(df)
rho_manual <- 1 - (6 * sum((rank_Hours - rank_Score)^2)) / (n * (n^2 - 1))
cat("手動計算的Spearman rho:", rho_manual, "\n")library(ggplot2)
ggplot(df, aes(x = Hours, y = Score)) +geom_point() +geom_smooth(method = "lm", se = FALSE, color = "red") +  # 線性趨勢線(對比用)labs(title = "學習時間與成績的Spearman相關 (rho=0.72)")

輸出:

	Spearman's rank correlation rhodata:  df$Hours and df$Score
S = 5248, p-value < 2.2e-16
alternative hypothesis: true rho is not equal to 0
sample estimates:rho 
0.7479952 手動計算的Spearman rho: 0.7479952 

從結果可以看到,結果顯示0.748,屬于正相關。而圖像顯示,如果用一般的方法,直接用線性函數去擬合,會忽略實際數據中彎曲的分布,即不知道數據在實際中的增長方向,會對后續數據的加工使用造成錯覺。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/87766.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/87766.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/87766.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

WSL - Linux 安裝 Anaconda3-2025.06-0 詳細教程 [WSL 分發版均適用]

一、檢查系統狀態 安裝前先確認 WSL - Linxu 已正常啟動&#xff08;比如 Ubuntu&#xff09;&#xff0c;網絡連接穩定&#xff0c;并且系統磁盤有足夠空間&#xff0c;一般建議預留至少 5GB 以上的可用空間&#xff0c;避免因空間不足導致安裝失敗。 二、下載安裝包 Anacond…

熱血三國建筑攻略表格

<!DOCTYPE html> <html lang"zh-CN"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>熱血三國建筑攻略表格</title><style>…

SpringBoot+MySQL醫院掛號系統源碼

概述 基于SpringBootMySQL開發的醫院掛號系統完整源碼&#xff0c;該系統功能完善&#xff0c;包含從患者掛號到醫生管理的全流程解決方案&#xff0c;采用主流技術棧開發&#xff0c;代碼規范易于二次開發。 主要內容 系統包含完整的前后臺功能模塊&#xff1a; ??前臺功…

Linux系統之MySQL數據庫基礎

目錄 一、概述 數據庫概念 數據庫的類型 關系型數據庫模型 關系數據庫相關概念 二、安裝 1、mariadb安裝 2、mysql安裝 3、啟動并開機自啟 4、本地連接&#xff08;本地登錄&#xff09; 三、mysqld數據庫配置與命令 yum安裝后生成的目錄 mysqld服務器的啟動腳本 …

MySQL--InnoDB存儲引擎--頁結構

目錄 一、頁的大小 二、頁的分類 三、頁頭和頁尾 3.1 頁頭--File Header 3.2 頁尾--File Trailer 3.3 LSN 四、數據行 五、頁中數據的查詢 六、事務和索引在頁中的記錄 一、頁的大小 前面介紹了每個數據頁默認大小為16KB&#xff0c;是操作系統“數據塊” 4KB 的整數倍…

卡車檢測數據集-700張圖片交通運輸管理 智能監控系統 道路安全監測

跌倒檢測數據集-4500張圖片&#x1f4e6; 已發布目標檢測數據集合集&#xff08;持續更新&#xff09;&#x1f69b; Deteccin de carpa 2 Computer Vision Project&#x1f4cc; 數據集概覽包含類別&#x1f3af; 應用場景&#x1f5bc; 數據樣本展示&#x1f527; 使用建議&a…

Python爬蟲實戰:研究pangu庫相關技術

1. 引言 1.1 研究背景與意義 在數字化信息傳播時代,中文文本排版質量直接影響信息傳達效果。規范的排版要求中文與西文、數字間保持合理空格間距,但人工處理不僅效率低,且易出現一致性問題。隨著互聯網中文內容爆發式增長,傳統人工排版已無法滿足需求。Python 作為高效的…

day48-考試系統項目集群部署

1. ?考試系統項目集群架構圖負載均衡說明7層負載通過nginx對http請求進行轉發&#xff08;uri,ua,類型&#xff09;4層負載對端口負載均衡&#xff08;后端&#xff09;2. &#x1f4dd;環境準備角色主機ip負載均衡lb01/lb02172.16.1.5/172.16.1.6前端web集群web01/web02172.1…

Redis+Caffeine雙層緩存策略對比與實踐指南

RedisCaffeine雙層緩存策略對比與實踐指南在高并發場景下&#xff0c;緩存是提升系統性能和并發處理能力的關鍵手段。常見的緩存方案包括遠程緩存&#xff08;如Redis&#xff09;和本地緩存&#xff08;如Caffeine&#xff09;。單層緩存各有優劣&#xff0c;結合兩者優勢的雙…

FastAPI+React19 ERP系統實戰 第02期

一、搭建環境 1.1 創建Python虛擬環境 切換Python版本: pyenv local 3.12創建虛擬環境: python -m venv venv激活虛擬環境: venv\Scripts\activate1.2 安裝FastAPI項目依賴 requirements.txt fastapi==0.109.1

百度AI文心大模型4.5系列開源模型評測,從安裝部署到應用體驗

2025年6月30日&#xff0c;百度突然宣布&#xff0c;將旗下最新的大語言模型文心大模型4.5&#xff08;ERNIE 4.5&#xff09;全系列開源&#xff0c;震動整個AI行業。百度在GitCode平臺上開源了文心大模型4.5系列&#xff0c;包括ERNIE-4.5-VL-424B-A47B-Base-PT等多個型號。此…

windows安裝maven環境

在maven官網下載安裝包 https://maven.apache.org/download.cgi 下載完成后安裝maven&#xff0c;一般下載編輯好的 創建個maven目錄解壓出來即可 配置環境變量 根據剛剛的安裝路徑&#xff0c;新建一個命名為MAVEN_HOME的系統變量 新建完成點開系統變量的Path項&#xff0c;…

MySQL(117)何進行數據庫安全加密?

數據庫安全加密是保護敏感數據免受未授權訪問的重要手段。以下是一個詳細深入的步驟&#xff0c;介紹如何進行數據庫安全加密&#xff0c;包括數據傳輸加密和數據存儲加密。 一. 數據傳輸加密 確保數據在傳輸過程中被加密&#xff0c;以防止中間人攻擊。我們以MySQL為例&#x…

工程化實踐——標準化Eslint、PrettierTS

前端工程化中的標準化工具&#xff08;如Prettier、ESLint、Husky等&#xff09;雖然大幅提升了開發效率和代碼質量&#xff0c;但在實際使用中也存在一些限制和挑戰。以下從工具特性、團隊協作、開發體驗等維度詳細分析常見限制&#xff0c;并以Prettier為核心舉例說明&#x…

應急響應靶場——web3 ——知攻善防實驗室

前景需要&#xff1a; 小苕在省護值守中&#xff0c;在靈機一動情況下把設備停掉了&#xff0c;甲方問&#xff1a;為什么要停設備&#xff1f;小苕說&#xff1a;我第六感告訴我&#xff0c;這機器可能被黑了。這是他的服務器&#xff0c;請你找出以下內容作為通關條件&#…

Ubuntu:Tomcat里面的catalina.sh

認識catalina.sh 1 啟動Tomcat catalina.sh start相當于startup.sh 2 停止Tomcat catalina.sh stop相當于shutdown.sh 3 前臺運行Tomcat 一般用于調試 catalina.sh run4 Tomcat腳本 編輯如下腳本run_tomcat.sh 里面的一些HOME位置改成自己的 #!/bin/shWORKDIR$(cd $(dirname $0…

【機器學習深度學習】模型微調時的4大基礎評估指標(1)

目錄 前言&#xff1a;基礎評估指標&#xff08;從 “對與錯” 到 “準與全”&#xff09; 一、基礎評估4大指標 二、類比理解 2.1 準確率&#xff08;Accuracy&#xff09;&#xff1a;整體對的比例 2.2 精確率&#xff08;Precision&#xff09;&#xff1a;你說是垃圾的…

關于 棧幀變化完整流程圖(函數嵌套)

一、什么是棧幀&#xff08;Stack Frame&#xff09; 當一個函數被調用時&#xff0c;會在棧上開辟一段空間&#xff0c;叫做 棧幀。 每個棧幀保存了&#xff1a; 函數的參數 返回地址&#xff08;從哪里跳回來&#xff09; 上一個棧幀的棧底指針&#xff08;保存調用者的 E…

new與malloc[c++面試系列]

new與malloc的區別new順從c的思想&#xff0c;在堆區申請一個對象&#xff0c;因此它會調用對象的構造函數進行初始化&#xff0c;它也應該調用構造函數&#xff1b;malloc在堆區申請一塊空間&#xff0c;用于存放資源new無需指定對象大小&#xff0c;可以自動計算對象大小進行…

Go語言的sync.Once和sync.Cond

一.sync.OnceOnce&#xff08;單次執行&#xff09;用途&#xff1a;確保某個操作只執行一次&#xff08;如初始化配置&#xff09;核心方法&#xff1a;Do(f func())&#xff1a;保證 f只執行一次package mainimport ("fmt""sync" )var (config map[strin…