【斯坦福因果推斷課程全集】1_隨機對照試驗1

目錄

The average treatment effect

Difference-in-means estimation

IID Sampling and Population Asymptotics

Example: The linear model

Regression adjustments with a linear model


隨機對照試驗(RCT)是統計因果推論的基礎。如果有的話,從隨機對照試驗中得出的證據通常被認為是金標準證據;即使由于倫理或實際原因無法進行隨機對照試驗,觀察性研究的質量通常也是根據觀察性研究與隨機對照試驗的近似程度來評估的。

今天的講座將從潛在結果模型的角度來估算 RCT 的平均治療效果,并討論回歸調整在因果效應估算中的作用。平均治療效果完全通過隨機化(或實驗設計)確定。回歸調整可用于減少方差,但回歸模型在確定平均治療效果方面不起任何作用。

The average treatment effect

我們通過潛在的結果來定義一種治療的因果效應。對于w∈{0,1}的二元治療,我們定義了潛在的結果Yi (1)和Yi (0)對應于第i個受試者的結果他們是否分別接受過治療。治療對第i個單位的因果效應是?\Delta_i=Y_i(1)-Y_i(0).

因果推論的根本問題在于,只能給給定個體分配一種干預,因此只能觀察到 Yi(0) 和 Yi(1) 中的一種。因此,永遠無法觀測到 ?i。

現在,盡管 ?i 本身從根本上說是不可知的,但我們可以(也許是顯著地)利用隨機實驗來了解 ?i 的某些特性。特別是,大型隨機實驗可以讓我們恢復平均干預效果(ATE)\tau=\mathbb{E}\left[Y_i(1)-Y_i(0)\right].

為此,假設我們觀察到n個獨立且同分布的樣本(Yi,Wi)滿足以下兩個性質:\begin{aligned}Y_i&=Y_i(W_i)&\text{(SUTVA)}\\W_i&\perp\{Y_i(0), Y_i(1)\}&\text{(random treatment assignment)}\end{aligned}

那么,均值差估計器

\hat{\tau}_{DM}=\frac1{n_1}\sum_{W_i=1}Y_i-\frac1{n_0}\sum_{W_i=1}Y_i,\quad n_w=|\{i:W_i=w\}|對平均治療效果是無偏不倚和一致的。

Difference-in-means estimation

τDM 的統計特性很容易建立。我們隨機干預分配假設的一個關鍵結果是,在所有潛在結果 \{Y_i(0),|Y_i(1)\}_{i=1}^n 和 n1 的條件下,所有單位都以相同的概率接受干預:

\mathbb{P}\begin{bmatrix}W_i=1&\{Y_i(0), Y_i(1)\}_{i=1}^n, n_1\end{bmatrix}=\frac{n_1}n,\quad i=1, \ldots, n.

因此,對于治療單位的平均結果,我們得到

\begin{aligned} &&&\begin{aligned}\mathbb{E}\left[\frac{1}{n_1}\sum_{W_i=1}Y_i \Big| \{Y_i(0), Y_i(1)\}_{i=1}^n , n_1\right]\end{aligned} \\ &&&=\mathbb{E}\left[\frac{1}{n_{1}}\sum_{i=1}^{n}W_{i}Y_{i} \Big| \{Y_{i}(0), Y_{i}(1)\}_{i=1}^{n} , n_{1}\right]& (\ldots) \\ &&&=\mathbb{E}\left[\frac{1}{n_1}\sum_{i=1}^nW_iY_i(1)\left| \{Y_i(0), Y_i(1)\}_{i=1}^n , n_1\right]\right. & \begin{aligned}(\mathrm{SUTVA})\end{aligned} \\ &&&=\frac{1}{n_1}\sum_{i=1}^nY_i(1)\mathbb{E}\left[W_i\left| \{Y_i(0), Y_i(1)\}_{i=1}^n , n_1\right]\right.& (\text{chain rule}) \\ &&&=\frac1n\sum_{i=1}^nY_i(1)& (\text{random assignment}), \end{aligned}而對照組的平均值也有類似的結果。因此,我們可以看到

\mathbb{E}\left[\hat{\tau}_{DM} \left| \{Y_i(0), Y_i(1)\}_{i=1}^n , n_1\right]=\tau_{SATE}:=\frac{1}{n}\sum_{i=1}^n\left(Y_i(1)-Y_i(0)\right).\quad(1.5)\right.

換句話說,僅僅由于隨機化,均值差估計器對研究中 n 個單位潛在結果的平均差異是無偏的。這個量 \tau_{SATE} 通常稱為樣本平均干預效果。

IID Sampling and Population Asymptotics

無偏性結果(1.5)在潛在結果的任何實現條件下都成立,這意味著,在無條件的情況下、

\mathbb{E}\left[\hat{\tau}_{DM}\right]=\mathbb{E}\left[Y_i(1)\right]-\mathbb{E}\left[Y_i(0)\right]=\tau.

此外,考慮到 IID 采樣,我們還可以將方差寫成

\left.\text{Var}\left[\hat{\tau}_{DM}\left|\begin{array}{c|c}n_0, n_1\end{array}\right.\right.\right]=\frac{1}{n_0}\text{Var}\left[Y_i(0)\right]+\frac{1}{n_1}\text{Var}\left[Y_i(1)\right].

一個標準的中心極限定理可以用來驗證這一點

\begin{aligned}\sqrt{n}\left(\hat{\tau}_{DM}-\tau\right)&\Rightarrow\mathcal{N}\left(0,V_{DM}\right), \\V_{DM}&=\text{Var}\left[Y_i(0)\right] \Big/ \mathbb{P}\left[W_i=0\right]+\text{Var}\left[Y_i(1)\right] \Big/ \mathbb{P}\left[W_i=1\right].\end{aligned}\quad(1.6)

最后,請注意,我們可以通過常規插件估計器來估計 VDM,為 τ 建立有效的高斯置信區間:

\lim_{n\to\infty}\mathbb{P}\left[\tau\in\left(\hat{\tau}_{DM}\pm\Phi^{-1}(1-\alpha/2)\sqrt{\widehat{V}_{DM}/n}\right)\right]=1-\alpha,\quad(1.7)

其中,Φ為標準高斯累積分布函數,

\widehat{V}_{DM}=\frac1{n_1-1}\sum_{W_i=1}\left(Y_i-\frac1{n_1}\sum_{W_i=1}Y_i\right)^2+\frac1{n_0-1}\sum_{W_i=0}\left(Y_i-\frac1{n_0}\sum_{W_i=0}Y_i\right)^2

從某種角度看,上述內容就是隨機試驗中估計平均干預效果所需要的全部內容。均值差估算器\hat{\tau}_{DM} 是一致的,可以進行有效的漸進推斷;此外,該估算器的實現非常簡單,很難 "作弊"(不擇手段的分析師幾乎不可能嘗試不同的估算策略,并報告最接近他們想要的答案)。

另一方面,\hat{\tau}_{DM} 是否是使用數據的 "最優 "方法,即在給定樣本量下提供最準確的 τ 值,這一點還很不明確。下面,我們將嘗試看看是否/何時可以做得更好。

Example: The linear model

為了更好地理解 \hat{\tau}_{DM} 的行為,研究一下特殊情況是有幫助的。首先,我們考慮線性模型: 我們假設?(X_i,Y_i,W_i) 的生成方式為

Y_i(w)=c_{(w)}+X_i\beta_{(w)}+\varepsilon_i(w), \mathbb{E}\left[\varepsilon_i(w) \big| X_i\right]=0, \mathrm{Var}\left[\varepsilon_i(w) \big| X_i\right]=\sigma^2. (1.8)

在這里,\hat{\tau}_{DM} 并不使用 X_i;但是,我們可以根據 X_i 的分布來描述它的行為。在整個分析過程中,為簡單起見,我們假設我們處于一個平衡的隨機試驗中,其中

\mathbb{P}\left[W_{i}=0\right]=\mathbb{P}\left[W_{i}=1\right]=\frac{1}{2}.

此外,我們假設(但不失一般性):

\mathbb{E}\left[X\right]=0,\quad\mathrm{and~define}\quad A=\mathrm{Var}\left[X\right].

假設 \mathbb{E}\left[X\right]=0 并不失一般性,因為我們今天要考慮的所有估計器都是平移不變的(當然,不能讓分析師利用 \mathbb{E}\left[X\right]=0 的知識)。

在這種情況下,我們可以將 \hat{\tau}_{DM} 的漸近方差寫成

\begin{aligned} V_{DM}& \begin{aligned}=\text{Var}\left[Y_i(0)\right] \Big/ \mathbb{P}\left[W_i=0\right]+\text{Var}\left[Y_i(1)\right] \Big/ \mathbb{P}\left[W_i=1\right]\end{aligned} \\ &=2\left(\mathrm{Var}\left[X_i\beta_{(0)}\right]+\sigma^2\right)+2\left(\mathrm{Var}\left[X_i\beta_{(1)}\right]+\sigma^2\right) \\ &&(1.9) \\ &=4\sigma^{2}+2\begin{Vmatrix}\beta_{(0)}\end{Vmatrix}_{A}^{2}+2\begin{Vmatrix}\beta_{(1)}\end{Vmatrix}_{A}^{2} \\ &=4\sigma^{2}+\begin{Vmatrix}\beta_{(0)}+\beta_{(1)}\end{Vmatrix}_{A}^{2}+\begin{Vmatrix}\beta_{(0)}-\beta_{(1)}\end{Vmatrix}_{A}^{2}, \end{aligned}

\left\|v\right\|_A^2=v^\prime Av.

這是τ的最佳估計器嗎?

Regression adjustments with a linear model

如果我們假設是線性模型(1.8),那么我們很自然地想要使用它來進行更好的估計。請注意,給定這個模型,我們可以將該ATE寫成

\tau=\mathbb{E}\left[Y(1)-Y(0)\right]=c_{(1)}-c_{(0)}+\mathbb{E}\left[X\right]\left(\beta_{(1)}-\beta_{(0)}\right).

這表明了一個普通的最小二乘估計量

\hat{\tau}_{OLS}=\hat{c}_{(1)}-\hat{c}_{(0)}+\overline{X}\left(\hat{\beta}_{(1)}-\hat{\beta}_{(0)}\right),\quad\overline{X}=\frac1n\sum_{i=1}^nX_i,

其中 (\hat{c}_{(w)}, \hat{\beta}_{(w)})?是通過對W_{i}=w的觀察結果運行OLS獲得的(即,我們對處理單元和控制單元運行單獨的回歸)。關于OLS的標準結果表明(回想一下,wlog,我們使用 \mathbb{E}\left[X\right]=0?)

\sqrt{n_w}\left(\begin{pmatrix}\hat c_{(w)}\\\hat\beta_{(w)}\end{pmatrix}-\begin{pmatrix}c_{(w)}\\\beta_{(w)}\end{pmatrix}\right)\Rightarrow\mathcal N\left(0, \sigma^2\begin{pmatrix}1&0\\0&A^{-1}\end{pmatrix}\right).

特別地,我們發現\hat{c}_{(0)}, \hat{c}_{(1)}, \hat{\beta}_{(0)}, \hat{\beta}_{(1)}\overline{X}都是漸近獨立的。然后,我們可以寫

\begin{aligned}\hat{\tau}_{OLS}-\tau&=\underbrace{\hat{c}_{(1)}-c_{(1)}}_{\approx\mathcal{N}(0,\sigma^2/n_1)}-\underbrace{\hat{c}_{(0)}-c_{(0)}}_{\approx\mathcal{N}(0,\sigma^2/n_0)}+\underbrace{\overline{X}\left(\beta_{(1)}-\beta_{(0)}\right)}_{\approx\mathcal{N}\left(0,\left\|\beta_{(1)}-\beta_{(0)}\right\|_A^2/n\right)}\\&+\underbrace{\overline{X}\left(\hat{\beta}_{(1)}-\hat{\beta}_{(0)}-\beta_{(1)}+\hat{\beta}_{(0)}\right)}_{\mathcal{O}_P(1/n)},\end{aligned}

這就引出了中心極限定理

\begin{aligned}\sqrt{n}\left(\hat{\tau}_{OLS}-\tau\right)\Rightarrow\mathcal{N}\left(0,V_{OLS}\right),\quad V_{OLS}=4\sigma^2+\left\|\beta_{(0)}-\beta_{(1)}\right\|_A^2.\end{aligned}

特別要注意的是,V_{DM}=V_{OLS}+\left\|\beta_{(0)}+\beta_{(1)}\right\|_{A}^{2}?,因此OLS實際上有助于減少線性模型中的漸近誤差。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/20589.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/20589.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/20589.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

關于FPGA 使用SPI FLASH固化時如何配置固化參數

關于FPGA 使用SPI FLASH固化時如何配置固化參數 EDA工具:Vivado 關于FPGA 使用SPI FLASH固化時如何配置固化參數一、引言二、如何設置固化參數:使用50M的速度 ,SPI為X4 ,以及bit壓縮第一:點open implenment design第二…

Android之onMeasure的三種模式

Overrideprotected void onMeasure(int widthMeasureSpec, int heightMeasureSpec) {super.onMeasure(widthMeasureSpec, heightMeasureSpec);}在 Android 中,onMeasure() 方法是 View 或 ViewGroup 中的一個重要方法,用于測量視圖的大小。在 onMeasure(…

安裝軟件缺少dll文件怎么辦,分享多種解決dll問題的方法

在計算機使用過程中,我們經常會遇到安裝軟件時提示缺少dll文件的問題。這種情況通常會導致軟件無法正常運行或啟動。為了解決這個問題,我總結了以下五種方法,希望對大家有所幫助。 一,了解DLL文件是什么 動態鏈接庫(D…

簡單說說我對集成學習算法的一點理解

概要 集成學習(Ensemble Learning)是一種機器學習技術框架,它通過構建并結合多個學習器(也稱為個體學習器或基學習器)來完成學習任務。 集成學習旨在通過組合多個基學習器的預測結果來提高整體模型的性能。每個基學習…

常見儀表盤指示燈的含義,這次夠全了!

汽車是當前主要的交通工具之一,給人們的工作、生活提供了便利。大家在學會開車的同時,也得了解一些基本的汽車常識,可以及時的發現車輛的問題,并作出正確的判斷,以此降低車輛的損耗和維修成本。其中最基本的&#xff0…

房產證上加名?手把手教你操作,省錢又省心!

隨著《民法典》的實施,房產的權屬問題愈發受到重視。夫妻雙方及其親屬常希望能在房產證上增添自己的名字,以保障各自的權益。那么,房產證上到底能寫幾個名字呢?以下是對這一問題的詳細解答。 一、房產證命名無固定限制 在購房時&…

準確-K8s系列文章-修改containerd 默認數據目錄

修改 Kubernetes 集群中 containerd 默認數據目錄為 /data/containerd 前言 本文檔適用于 Kubernetes 1.24 及以上版本的集群,介紹如何將 containerd 默認的數據目錄從 /var/lib/containerd 修改為 /data/containerd。 步驟 1. 停止 containerd 服務(慎重!!!需評估風險!…

iOS中的UIScene和UISceneDelegate

目錄 ???????前言 一、AppDelegate和SceneDelegate的關系 1.AppDelegate 2.SceneDelegate 3.info.plist配置 4.生命周期方法對比 1.應用啟動 2.進入前臺 3.進入后臺 5.何時使用AppDelegate和SceneDelegate 1.AppDelegate 2.SceneDelegate 前言 在iOS 13及之…

Linux內核編程入門:深度探索與實戰挑戰

Linux內核編程入門:深度探索與實戰挑戰 在操作系統的心臟地帶,Linux內核以其強大、靈活和開源的特性吸引著眾多程序員。對于那些渴望深入了解系統底層機制并親手塑造操作系統的勇士們,Linux內核編程無疑是一個極具挑戰性和吸引力的領域。本文…

民國漫畫雜志《時代漫畫》第39期.PDF

時代漫畫39.PDF: https://url03.ctfile.com/f/1779803-1248636473-6bd732?p9586 (訪問密碼: 9586) 《時代漫畫》的雜志在1934年誕生了,截止1937年6月戰爭來臨被迫停刊共發行了39期。 ps: 資源來源網絡!

Qt for Android : 使用libusb做CH340x串口傳輸的底層USB庫

簡介 Qt for Android自帶的串口方案并沒有適用在高的API版本中, 會出現permission denied的訪問問題, 所以就需要使用Android API, 也就是在CPP中使用JNI方式進行調用, 為了開發的方便, 使用libusb庫作為替代的底層usb…

SpringBoot注解--10--@Bean,對象注入的三種方法

提示:文章寫完后,目錄可以自動生成,如何生成可參考右邊的幫助文檔 文章目錄 Bean一、如何使用方法注解注意Bean 的命名規則,當沒有設置 name 屬性時,那么 bean 默認的名稱就是方法名,當設置了 name 屬性之后…

解析Java中1000個常用類:Runnable 類,你學會了嗎?

在 Java 編程中,處理并發和多線程是一個重要的主題。為了簡化多線程編程,Java 提供了多種工具和類,其中最基本的一個工具就是 Runnable 接口。 Runnable 接口為創建和管理線程提供了一種標準的方式。本文將詳細介紹 Runnable 接口的定義、實現原理、應用場景,并通過示例展…

33【Aseprite 作圖】樹——拆解

1 樹葉 畫樹葉真累啊,可以先畫一個輪廓,細節一點點修 2 1 2 ;2 2 2 (橫著橫),這樣一點點畫樹葉 填充顏色,用了噴霧工具 2 樹干部分 輪廓部分,左邊的是3 3 3 ;上下都是…

網頁音頻提取在線工具有哪些 網頁音頻提取在線工具下載

別再到處去借會員賬號啦。教你一招,無視版權和地區限制,直接下載網頁中的音頻文件。沒有復雜的操作步驟,也不用學習任何代碼。只要是網頁中播放的音頻文件,都可以把它下載到本地保存。 一、網頁音頻提取在線工具有哪些 市面上的…

【數據結構】二叉樹:簡約和復雜的交織之美

專欄引入: 哈嘍大家好,我是野生的編程萌新,首先感謝大家的觀看。數據結構的學習者大多有這樣的想法:數據結構很重要,一定要學好,但數據結構比較抽象,有些算法理解起來很困難,學的很累…

Transformer中的位置編碼PE(position encoding)

Transformer中的位置編碼PE(position encoding) 1.提出背景 transformer模型的attention機制并沒有包含位置信息,即一句話中詞語在不同的位置時在transformer中是沒有區別的 2.解決背景 給encoder層和decoder層的輸入添加了一個額外的向量Positional Encoding&a…

平移數據c++

題目描述 將a數組中第一個元素移到數組末尾,其余數據依次往前平移一個位置。 輸入 第一行為數組a的元素個數n; 第二行為n個小于1000的正整數。 輸出 平移后的數組元素,每個數用一個空格隔開。 樣例輸入 10 1 2 3 4 5 6 7 8 9 10 樣例輸出 2 3 …

【專利 超音速】一種光伏檢測系統

申請號CN202410053901.0公開號(公開)CN118032774A申請日2024.01.12申請人(公開)超音速人工智能科技股份有限公司發明人(公開)張俊峰(總); 葉長春(總); 許春夏 摘要 本發明公開一種光伏檢測系統&#xff0…

iotdb時序庫在火電設備鍋爐場景下的實踐【原創文字,IoTDB社區可進行使用與傳播】

一.概述 1.1 說明 本文章主要介紹iotdb數據庫在電站鍋爐工業場景下,對輔助智能分析與預警的使用介紹。 【原創文字,IoTDB社區可進行使用與傳播】 1.2 項目背景 隨著人工智能算法在電力領域的發展,以及燃煤鍋爐設備精細化調整需求的增加&…