Bootstrap法進行隨機模擬

一、問題背景

# 26名神經功能受損兒童接受了兩組(A組與B組)空間知覺測試,得分如下A組和B組數據。
# A組數據
x_A <- c(48, 36, 20, 29, 42, 42, 20, 42, 22, 41, 45, 14, 6, 0, 33, 28, 34, 4, 32, 24, 47, 41, 24, 26, 30, 41)# B組數據
x_B <- c(42, 33, 16, 39, 38, 36, 15, 33, 20, 43, 34, 22, 7, 15, 34, 29, 41, 13, 38, 25, 27, 41, 28, 14, 28, 40)

二、問題求解

問題一

  • 給出A組與B組得分的皮爾遜相關系數的Bootstrap點估計、區間估計(95%置信區間)

Bootstrap估計皮爾遜相關系數及置信區間的步驟原理

  1. 計算原始樣本的皮爾遜相關系數
    先對A組和B組的原始數據計算皮爾遜相關系數,作為點估計。

  2. Bootstrap重抽樣
    設定Bootstrap重復次數B(如1000),每次從原始數據中有放回地隨機抽取n對(n為樣本容量)A組和B組數據,形成新的樣本對。

  3. 每次重抽樣計算相關系數
    對每一次Bootstrap樣本,計算其皮爾遜相關系數,記錄下來,最終得到B個相關系數的Bootstrap分布。

  4. 點估計與置信區間

    • 點估計:用原始樣本的皮爾遜相關系數。
    • 置信區間:對B個Bootstrap相關系數,取其2.5%和97.5%的分位數,作為95%置信區間的下限和上限。
  5. 結果解釋
    通過Bootstrap方法,可以在不依賴正態分布假設的情況下,獲得相關系數的穩健置信區間。

    公式原理說明

皮爾遜相關系數公式:

設有兩組數據 X = ( x 1 , x 2 , . . . , x n ) X = (x_1, x_2, ..., x_n) X=(x1?,x2?,...,xn?) Y = ( y 1 , y 2 , . . . , y n ) Y = (y_1, y_2, ..., y_n) Y=(y1?,y2?,...,yn?),其皮爾遜相關系數計算公式為:
r = ∑ i = 1 n ( x i ? x ˉ ) ( y i ? y ˉ ) ∑ i = 1 n ( x i ? x ˉ ) 2 ∑ i = 1 n ( y i ? y ˉ ) 2 r = \frac{\sum_{i=1}^n (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum_{i=1}^n (x_i - \bar{x})^2} \sqrt{\sum_{i=1}^n (y_i - \bar{y})^2}} r=i=1n?(xi??xˉ)2 ?i=1n?(yi??yˉ?)2 ?i=1n?(xi??xˉ)(yi??yˉ?)?
其中 x ˉ \bar{x} xˉ y ˉ \bar{y} yˉ? 分別為 X X X Y Y Y 的均值。

Bootstrap置信區間原理:

  1. 從原始樣本 ( x i , y i ) (x_i, y_i) (xi?,yi?) 有放回地抽取 n n n 對,重復 B B B 次,得到 B B B 組Bootstrap樣本。
  2. 每組Bootstrap樣本計算皮爾遜相關系數 r b ? r^*_b rb?? b = 1 , 2 , . . . , B b=1,2,...,B b=1,2,...,B
  3. 置信區間為 r ? r^* r? 的第2.5百分位數和第97.5百分位數:
    CI 95 % = [ Q 0.025 ( r ? ) , Q 0.975 ( r ? ) ] \text{CI}_{95\%} = \left[ Q_{0.025}(r^*),\ Q_{0.975}(r^*) \right] CI95%?=[Q0.025?(r?),?Q0.975?(r?)]
    其中 Q p ( r ? ) Q_p(r^*) Qp?(r?) 表示 r ? r^* r? 的第 p p p 分位數。

這種方法無需對原始數據分布做正態性假設,適用于樣本量較小或分布未知的情況。

set.seed(1234)
n <- length(x_A)
B <- 1000 # Bootstrap重復次數
boot_corr <- numeric(B)for (i in 1:B) {idx <- sample(1:n, n, replace = TRUE)boot_corr[i] <- cor(x_A[idx], x_B[idx], method = "pearson")
}# 點估計
corr_hat <- cor(x_A, x_B, method = "pearson")
# 置信區間
ci <- quantile(boot_corr, c(0.025, 0.975))cat("皮爾遜相關系數點估計:", round(corr_hat, 3), "\n")
cat("Bootstrap 95%置信區間: [", round(ci[1], 3), ",", round(ci[2], 3), "]\n")
皮爾遜相關系數點估計: 0.821 
Bootstrap 95%置信區間: [ 0.662 , 0.913 ]

問題二

  • 以B組得分為因變量,A組得分為自變量,建立一元線性回歸模型: B i = b + a A i + ? i ( i = 1 , 2 , . . . , 26 ) B_i = b +aA_i + \epsilon_i(i=1,2,...,26) Bi?=b+aAi?+?i?(i=1,2,...,26),請給出a的Bootstrap點估計和假設檢驗

Bootstrap點估計與假設檢驗的具體操作步驟

  1. 建立一元線性回歸模型
    用B組得分為因變量,A組得分為自變量,擬合模型 B i = b + a A i + ? i B_i = b + aA_i + \epsilon_i Bi?=b+aAi?+?i?,得到回歸系數 a a a的原始點估計。

  2. Bootstrap重抽樣
    設定Bootstrap重復次數 B B B(如1000),每次從原始數據中有放回地隨機抽取 n n n ( A i , B i ) (A_i, B_i) (Ai?,Bi?),形成新的樣本對。

  3. 每次重抽樣擬合回歸模型
    對每一次Bootstrap樣本,擬合一元線性回歸模型,記錄回歸系數 a b ? a^*_b ab??,最終得到 B B B a ? a^* a?的Bootstrap分布。

  4. 點估計與置信區間

    • 點估計:用原始樣本擬合得到的 a a a
    • 置信區間:對 B B B a ? a^* a?,取其2.5%和97.5%的分位數,作為 a a a的95%置信區間。
  5. 假設檢驗(a=0)
    計算 a = 0 a=0 a=0在Bootstrap分布中的分位數,得到雙側 p p p值: p = 2 × min ? ( 比例 ( a ? ≥ 0 ) , 比例 ( a ? ≤ 0 ) ) p = 2 \times \min(\text{比例}(a^* \geq 0), \text{比例}(a^* \leq 0)) p=2×min(比例(a?0),比例(a?0))。若 p p p值較小,說明 a a a顯著不為0。

  6. 結果解釋
    通過Bootstrap方法,可以在不依賴正態分布假設的情況下,對回歸系數 a a a進行穩健的點估計、區間估計和顯著性檢驗。

set.seed(1234)
n <- length(x_A)
B <- 1000
boot_a <- numeric(B)for (i in 1:B) {idx <- sample(1:n, n, replace = TRUE)fit <- lm(x_B[idx] ~ x_A[idx])boot_a[i] <- coef(fit)[2]
}# 點估計
fit_full <- lm(x_B ~ x_A)
a_hat <- coef(fit_full)[2]# 置信區間
ci_a <- quantile(boot_a, c(0.025, 0.975))# 假設檢驗(p值):計算a=0在bootstrap分布中的分位數
p_value <- 2 * min(mean(boot_a >= 0), mean(boot_a <= 0))cat("回歸系數a的點估計:", round(a_hat, 3), "\n")
cat("Bootstrap 95%置信區間: [", round(ci_a[1], 3), ",", round(ci_a[2], 3), "]\n")
cat("a=0的雙側p值:", round(p_value, 4), "\n")
回歸系數a的點估計: 0.656 
Bootstrap 95%置信區間: [ 0.49 , 0.847 ]
a=0的雙側p值: 0 

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/84842.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/84842.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/84842.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Spring AI 多模型智能協作工作流實現指南

Spring AI 多模型智能協作工作流實現指南 說明 本文檔旨在指導開發者基于 Spring AI 框架&#xff0c;在 Spring Boot 2 環境下集成多種主流大語言模型&#xff08;如 OpenAI ChatGPT、Deepseek、阿里云通義千問等&#xff09;&#xff0c;并提供從環境配置、模型調用、流式輸…

C語言中清空緩存區到底寫到哪里比較好

文章目錄 問題背景%d和%c讀取緩沖區的差別清空緩存區 問題背景 在寫C語言的命令行程序時&#xff0c;我們經常會用到用戶輸入和標準輸出&#xff0c;特別的&#xff0c;當用戶輸入后&#xff0c;我們發現程序運行不是我們要的樣子&#xff0c;這個時候&#xff0c;很可能就是輸…

計算機視覺與深度學習 | 基于 YOLOv8 + BeautyGAN + CodeFormer + Face Parsing 實現簡單的人臉美顏

人臉美顏 **一、算法流程圖****二、完整代碼實現**1. 環境準備2. 完整代碼(face_beautify.py)**三、核心算法公式**1. YOLOv8檢測損失函數2. BeautyGAN損失函數3. CodeFormer圖像重建公式**四、關鍵實現細節**1. 多尺度人臉處理2. 顏色校正策略**五、模型下載清單****六、性能…

如何在WordPress中選擇最佳Elementor主題:專家指南

當你在WordPress建站過程中逐步積累了經驗&#xff0c;你可能會發覺&#xff0c;基礎和進階主題已難以完全滿足你的需求。如果你需要更復雜的功能、更靈活的布局設計&#xff0c;甚至高級定制效果&#xff0c;那么就需要選擇更加專業的主題。在這篇文章中&#xff0c;我將為你推…

FPGA高速接口 mipi lvds cameralink hdml 千兆網 sdi

mipi: https://blog.csdn.net/SDJ_success/article/details/146541776 cameralink CameraLink協議 CameraLink協議是一種專門針對機器視覺應用領域的串行通信協議&#xff0c;它使用低壓差分信號(LVDS)進行數據的傳輸和通信。CameraLink標準是在ChannelLink標準的基礎上多加了…

手機收不到WiFi,手動輸入WiFi名稱進行連接不不行,可能是WiFi頻道設置不對

以下是電腦上分享WiFi后&#xff0c;部分手機可以看到并且能連接&#xff0c;部分手機不行&#xff0c;原因是&#xff1a;頻道設置為5GHz&#xff0c;修改成&#xff0c;任何可用頻率&#xff0c;則可

12.Java 對象冷凍術:從用戶登錄到游戲存檔的序列化實戰

目錄 一、引言 二、用戶登錄存檔&#xff1a;讓賬號信息「凍齡」不變 1. 給對象貼「冷凍標簽」&#xff1a;實現 Serializable 2. 冷凍與解凍實戰&#xff1a;把用戶存進文件 3. 演示場景 三、游戲存檔復活&#xff1a;讓角色進度「穿越時空」 1. 復雜對象冷凍&#xff…

conda 環境中opencv 報錯以及其他報錯

如題&#xff0c;通過 conda install opencv 然后遇到 ImportError: DLL load failed while importing cv2: 找不到指定的模塊。 參考網絡相關答案 通過conda 卸載 然后通過 pip3 安裝opencv-pyhton https://stackoverflow.com/questions/75387197/anaconda-importerror-dll-…

(已開源-CVPR2024) RadarDistill---NuScenes數據集Radar檢測第一名

本文介紹一篇Radar 3D目標檢測模型&#xff1a;RadarDistill。雷達數據固有的噪聲和稀疏性給3D目標檢測帶來了巨大挑戰。在本文中&#xff0c;作者提出了一種新的知識蒸餾(KD)方法RadarDistill&#xff0c;它可以通過利用激光雷達數據來提高雷達數據的表征。RadarDistill利用三…

創建型設計模式之Singleton(單例)設計模式

創建型設計模式之Singleton&#xff08;單例&#xff09;設計模式 摘要&#xff1a; Singleton&#xff08;單例&#xff09;設計模式確保一個類僅有一個實例&#xff0c;并提供全局訪問點。其結構包含一個靜態方法getInstance()用于獲取唯一實例&#xff0c;構造方法私有化防…

C++11:系統類型增強

C11&#xff1a;系統類型增強 強枚舉類型作用域限定隱式類型轉換指定類型前置聲明 類型別名 using模板別名復雜指針別名 auto限制性 auto注意事項 nullptrdecltype 強枚舉類型 在C98的枚舉設計中&#xff0c;存在很多缺陷&#xff0c;為此C11推出了強枚舉來代替舊版的枚舉&…

linux 內核warn_on/Bug_on

1,warn_on() warn_on() 是 Linux 內核中用于報告潛在問題或警告的宏。與 bug_on() 不同&#xff0c;bug_on() 通常用于報告嚴重錯誤&#xff0c;其觸發往往會導致內核Oops或panic&#xff0c;而 warn_on() 則用于報告不太嚴重的、可能只是潛在問題或預期外情況的情況。它的觸…

SQL輸出20個9

在SQL Server中要輸出20個連續的9&#xff0c;可以使用以下幾種方法&#xff1a; 使用REPLICATE函數重復生成字符&#xff1a; SELECT REPLICATE(9, 20) AS Result 2. 使用UNION ALL聯合查詢生成多行&#xff1a; SELECT 9 AS Number FROM (VALUES (1),(1),(1),(1),(1),(1),…

懶人云電腦方案:飛牛NAS遠程喚醒 + 節點小寶一鍵喚醒、遠程控制Windows!

后臺高頻問題解答&#xff1a; “博主&#xff0c;飛牛NAS能定時開關機了&#xff0c;能不能讓它順便把家里Windows電腦也遠程喚醒控制&#xff1f;最好點一下就能連&#xff0c;不用記IP端口那種&#xff01;” 安排&#xff01;今天這套方案完美實現&#xff1a; ? 飛牛NAS…

Linux特殊符號

1 管道符| 管道符號 | 用于將一個命令的輸出作為另一個命令的輸入。這種機制允許將多個命令組合在一起&#xff0c;形成一個數據處理鏈&#xff0c;每個命令處理前一個命令的輸出&#xff0c;從而實現復雜的數據處理任務。示例 # 查詢/var/log目錄下所有的log文件,并進行分頁…

初識Docker:容器化技術的入門指南

初識Docker&#xff1a;容器化技術的入門指南 一、Docker是什么&#xff1a;容器化技術的核心概念二、Docker的核心優勢2.1 環境一致性2.2 高效部署與快速迭代2.3 資源利用率高 三、Docker的安裝與基本使用3.1 安裝Docker3.2 Docker基本概念3.3 第一個Docker容器體驗 四、Docke…

商務風企業公司推廣培訓計劃PPT模版分享

商務風企業公司推廣培訓計劃PPT模版分享&#xff1a;商務培訓推廣計劃PPT模版https://pan.quark.cn/s/063282eaf739 第1套PPT模版&#xff0c;綠橙配色&#xff0c;幾何圖形拼接背景&#xff0c;有中英文標題和占位文本。 第2套PPT模版是黑金高端商務風格&#xff0c;有匯報人…

深入理解Nginx:詳盡配置手冊

Nginx是一款高性能的HTTP和反向代理服務器&#xff0c;廣泛應用于負載均衡、緩存和Web服務器等場景。隨著互聯網應用的快速發展&#xff0c;掌握Nginx的配置和優化技巧顯得尤為重要。在本篇文章中&#xff0c;我們將深入探討Nginx的配置&#xff0c;幫助你更好地理解和使用這款…

每日leetcode

1572. 矩陣對角線元素的和 - 力扣&#xff08;LeetCode&#xff09; 題目 給你一個正方形矩陣 mat&#xff0c;請你返回矩陣對角線元素的和。 請你返回在矩陣主對角線上的元素和副對角線上且不在主對角線上元素的和。 示例 1&#xff1a; 輸入&#xff1a;mat [[1,2,3], …

Server 9 ,在 VMware 虛擬機上安裝 Windows 系統完整指南

目錄 前言 一、準備工作 1.1 準備安裝文件 1.2 安裝VMware軟件 1.3 創建新的虛擬機 1.4 開啟虛擬機 二、注意事項 2.1 調整硬件設置 2.2 啟動順序配置 2.3 固件類型選擇 2.4 安全啟動配置 三、安裝優化 3.1 安裝VMware Tools 3.2 系統更新與激活 四、更多操作 ?…