因果推理導論第2課 因果推斷假設
- 前言
- 一、假設
- 1、 Ignorability / Exchangeability
- 2、條件可交換
- 二、估計
前言
第一節課通過一些例子說明了為什么要做因果推斷,以及通過控制混雜因素計算因果效應;這一節課將圍繞為何控制混雜因素計算因果效應這一方法成立,講述其涉及到的一些假設,與基于假設后因果公式上的推導.
注:小寫字符代表單個目標,大寫字符代表變量
一、假設
案例說明:定義 Υ ( 1 ) \Upsilon (1) Υ(1)為接受治療T=1的潛在效果, Υ ( 0 ) \Upsilon (0) Υ(0)為不接受治療T=0的潛在效果.
先回憶一下計算因果效應其公式 E [ Υ ( 1 ) ? Υ ( 0 ) ] = E [ Υ ( 1 ) ] ? E [ Υ ( 0 ) ] , 線性期望展開 E[\Upsilon (1)-\Upsilon (0)]=E[\Upsilon (1)]-E[\Upsilon (0)],線性期望展開 E[Υ(1)?Υ(0)]=E[Υ(1)]?E[Υ(0)],線性期望展開,我們知道無法直接計算的原因是我們無法得知單個個體同時接受不同治療方法T(除非時間回溯,否則前后接受其初始條件已變化),得到其潛在效果.而機器學習沒有這個問題是因為其目標是預測觀察到的結果.
1、 Ignorability / Exchangeability
因此我們從能獲取的信息入手,首先觀測里我們知道具體的治療方法T與其效果,那么能不能把治療方法作為條件引入?若治療方法是隨機分配的,那么這個治療條件是不是就不影響其潛在效果的計算了,對的,因此給出忽略性假設,當該假設成立時,下面等式成立.
E [ Υ ( 1 ) ] ? E [ Υ ( 0 ) ] ? = E [ Υ ( 1 ) ∣ T = 1 ] ? E [ Υ ( 0 ) ∣ T = 0 ] = E [ Υ ∣ T = 1 ] ? E [ Υ ∣ T = 0 ] E[\Upsilon (1)]-E[\Upsilon (0)] ?=E[\Upsilon (1)|T=1]-E[\Upsilon (0)|T=0]\\=E[\Upsilon |T=1]-E[\Upsilon |T=0] E[Υ(1)]?E[Υ(0)]?=E[Υ(1)∣T=1]?E[Υ(0)∣T=0]=E[Υ∣T=1]?E[Υ∣T=0]
該假設從因果圖上理解,就是T條件沒有混雜因素影響,其不同治療方法的群體是可比較的,因此假設也叫可交換性假設
根據假設得到定義,如果一個因果量化可由純粹的統計量化計算,那么它是可識別的.
當然第一節課也說到,不同治療T群體的可比較性是比較不現實的(比如測試基因對糖尿病的因果作用,沒有辦法隨機改變一個人的基因),因此它會收到混雜因素的影響.
2、條件可交換
有混雜因子X,這時公式變為 E [ ( Υ ( 1 ) ? Υ ( 0 ) ∣ X ] = E [ Υ ( 1 ) ∣ X ] ? E [ Υ ( 0 ) ∣ X ] ? = E [ Υ ( 1 ) ∣ T = 1 , X ] ? E [ Υ ( 0 ) ∣ T = 0 , X ] = E [ Υ ∣ T = 1 , X ] ? E [ Υ ∣ T = 0 , X ] E[(\Upsilon (1)-\Upsilon (0)|X]\\=E[\Upsilon (1)|X]-E[\Upsilon (0)|X] \\?=E[\Upsilon (1)|T=1,X]-E[\Upsilon (0)|T=0,X]\\=E[\Upsilon |T=1,X]-E[\Upsilon |T=0,X] E[(Υ(1)?Υ(0)∣X]=E[Υ(1)∣X]?E[Υ(0)∣X]?=E[Υ(1)∣T=1,X]?E[Υ(0)∣T=0,X]=E[Υ∣T=1,X]?E[Υ∣T=0,X]
當我們控制住X時,其群體又是可比較的了,其因果圖如下所示,滿足這個條件的時候其等式成立.這個條件即為假設2:條件可交換,也叫無混雜因子假設.這樣最后的因果量化可以由上面式子在X的邊際期望得到 E [ Υ ( 1 ) ] ? E [ Υ ( 0 ) ] = E X [ E [ Υ ∣ T = 1 , X ] ? E [ Υ ∣ T = 0 , X ] ] E[\Upsilon (1)]-E[\Upsilon (0)]=E_X[E[\Upsilon |T=1,X]-E[\Upsilon |T=0,X]] E[Υ(1)]?E[Υ(0)]=EX?[E[Υ∣T=1,X]?E[Υ∣T=0,X]]
同樣根據假設得定理調整式子,可以看到公式里面除了條件假設還有正值,一致性,無干擾假設,接下來再對后面幾個假設做簡要說明.
-
正值性:看我們公式是條件期望,那么回想一下貝葉斯公式,轉換一下,那么下述假設就會成為分母,若假設不成立就會導致除以0出現,那么調整公式就不成立了.
-
無干擾性:是指單個目標的治療不受其前后左右影響,就取決于自身的治療策略
-
一致性:指我們觀測到的 Υ \Upsilon Υ確實是由觀測到的T 產生的,還記得這個轉化不,如果一致性不成立,那么下面這個轉化也不成立了,當然這個很難理解假設會不成立,舉個例子,有狗無狗對情緒的影響,若實際實驗中,狗狗給了幼犬和老年犬兩個版本,那這個觀測值就不是剛剛開始定義的有狗無狗的T了,這樣觀測到的結果也不是由T得到的了.
所有假設定義合并一下可得到完整額公式變化:
二、估計
理論已經證明完成,那么實際應用上是如何使用的呢?
前面我們已經將因果量化轉為觀測值上期望計算(概率估計),接下來就是估計了. 舉一個例子,目標是看sodium這個藥對血壓的影響,其混雜因子是age,proteinuria,使用線性回歸模型進行估計,其因果量化取均值得到;由于我們使用的是線性模型,其因果量化就等于其擬合的模型sodium的系數.