【學習筆記】因果推理導論第2課

因果推理導論第2課 因果推斷假設

  • 前言
  • 一、假設
    • 1、 Ignorability / Exchangeability
    • 2、條件可交換
  • 二、估計

前言

第一節課通過一些例子說明了為什么要做因果推斷,以及通過控制混雜因素計算因果效應;這一節課將圍繞為何控制混雜因素計算因果效應這一方法成立,講述其涉及到的一些假設,與基于假設后因果公式上的推導.

注:小寫字符代表單個目標,大寫字符代表變量

一、假設

案例說明:定義 Υ ( 1 ) \Upsilon (1) Υ(1)為接受治療T=1的潛在效果, Υ ( 0 ) \Upsilon (0) Υ(0)為不接受治療T=0的潛在效果.
先回憶一下計算因果效應其公式 E [ Υ ( 1 ) ? Υ ( 0 ) ] = E [ Υ ( 1 ) ] ? E [ Υ ( 0 ) ] , 線性期望展開 E[\Upsilon (1)-\Upsilon (0)]=E[\Upsilon (1)]-E[\Upsilon (0)],線性期望展開 E[Υ(1)?Υ(0)]=E[Υ(1)]?E[Υ(0)],線性期望展開,我們知道無法直接計算的原因是我們無法得知單個個體同時接受不同治療方法T(除非時間回溯,否則前后接受其初始條件已變化),得到其潛在效果.而機器學習沒有這個問題是因為其目標是預測觀察到的結果.

1、 Ignorability / Exchangeability

因此我們從能獲取的信息入手,首先觀測里我們知道具體的治療方法T與其效果,那么能不能把治療方法作為條件引入?若治療方法是隨機分配的,那么這個治療條件是不是就不影響其潛在效果的計算了,對的,因此給出忽略性假設,當該假設成立時,下面等式成立.
E [ Υ ( 1 ) ] ? E [ Υ ( 0 ) ] ? = E [ Υ ( 1 ) ∣ T = 1 ] ? E [ Υ ( 0 ) ∣ T = 0 ] = E [ Υ ∣ T = 1 ] ? E [ Υ ∣ T = 0 ] E[\Upsilon (1)]-E[\Upsilon (0)] ?=E[\Upsilon (1)|T=1]-E[\Upsilon (0)|T=0]\\=E[\Upsilon |T=1]-E[\Upsilon |T=0] E[Υ(1)]?E[Υ(0)]?=E[Υ(1)T=1]?E[Υ(0)T=0]=E[Υ∣T=1]?E[Υ∣T=0]
在這里插入圖片描述

該假設從因果圖上理解,就是T條件沒有混雜因素影響,其不同治療方法的群體是可比較的,因此假設也叫可交換性假設
在這里插入圖片描述
根據假設得到定義,如果一個因果量化可由純粹的統計量化計算,那么它是可識別的.
在這里插入圖片描述
當然第一節課也說到,不同治療T群體的可比較性是比較不現實的(比如測試基因對糖尿病的因果作用,沒有辦法隨機改變一個人的基因),因此它會收到混雜因素的影響.

2、條件可交換

有混雜因子X,這時公式變為 E [ ( Υ ( 1 ) ? Υ ( 0 ) ∣ X ] = E [ Υ ( 1 ) ∣ X ] ? E [ Υ ( 0 ) ∣ X ] ? = E [ Υ ( 1 ) ∣ T = 1 , X ] ? E [ Υ ( 0 ) ∣ T = 0 , X ] = E [ Υ ∣ T = 1 , X ] ? E [ Υ ∣ T = 0 , X ] E[(\Upsilon (1)-\Upsilon (0)|X]\\=E[\Upsilon (1)|X]-E[\Upsilon (0)|X] \\?=E[\Upsilon (1)|T=1,X]-E[\Upsilon (0)|T=0,X]\\=E[\Upsilon |T=1,X]-E[\Upsilon |T=0,X] E[(Υ(1)?Υ(0)X]=E[Υ(1)X]?E[Υ(0)X]?=E[Υ(1)T=1,X]?E[Υ(0)T=0,X]=E[Υ∣T=1,X]?E[Υ∣T=0,X]
當我們控制住X時,其群體又是可比較的了,其因果圖如下所示,滿足這個條件的時候其等式成立.這個條件即為假設2:條件可交換,也叫無混雜因子假設.這樣最后的因果量化可以由上面式子在X的邊際期望得到 E [ Υ ( 1 ) ] ? E [ Υ ( 0 ) ] = E X [ E [ Υ ∣ T = 1 , X ] ? E [ Υ ∣ T = 0 , X ] ] E[\Upsilon (1)]-E[\Upsilon (0)]=E_X[E[\Upsilon |T=1,X]-E[\Upsilon |T=0,X]] E[Υ(1)]?E[Υ(0)]=EX?[E[Υ∣T=1,X]?E[Υ∣T=0,X]]
在這里插入圖片描述
在這里插入圖片描述
同樣根據假設得定理調整式子,可以看到公式里面除了條件假設還有正值,一致性,無干擾假設,接下來再對后面幾個假設做簡要說明.
在這里插入圖片描述

  • 正值性:看我們公式是條件期望,那么回想一下貝葉斯公式,轉換一下,那么下述假設就會成為分母,若假設不成立就會導致除以0出現,那么調整公式就不成立了.
    在這里插入圖片描述

  • 無干擾性:是指單個目標的治療不受其前后左右影響,就取決于自身的治療策略
    在這里插入圖片描述

  • 一致性:指我們觀測到的 Υ \Upsilon Υ確實是由觀測到的T 產生的,還記得這個轉化不,如果一致性不成立,那么下面這個轉化也不成立了,當然這個很難理解假設會不成立,舉個例子,有狗無狗對情緒的影響,若實際實驗中,狗狗給了幼犬和老年犬兩個版本,那這個觀測值就不是剛剛開始定義的有狗無狗的T了,這樣觀測到的結果也不是由T得到的了.
    在這里插入圖片描述
    所有假設定義合并一下可得到完整額公式變化:
    在這里插入圖片描述

二、估計

理論已經證明完成,那么實際應用上是如何使用的呢?
前面我們已經將因果量化轉為觀測值上期望計算(概率估計),接下來就是估計了. 舉一個例子,目標是看sodium這個藥對血壓的影響,其混雜因子是age,proteinuria,使用線性回歸模型進行估計,其因果量化取均值得到;由于我們使用的是線性模型,其因果量化就等于其擬合的模型sodium的系數.
在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/87547.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/87547.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/87547.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

VASP 教程:VASP 機器學習力場微調

機器學習力場(Machine-Learned Force Fields, MLFFs)作為一種新興的計算方法,已在第一性原理分子動力學(Ab Initio Molecular Dynamics, AIMD)模擬中展現出獨特優勢(參見 VASP Wiki:Category:Ma…

Java+Vue開發的倉庫管理系統,實時監控庫存,精準統籌貨物出入與調配

前言: 在當今競爭激烈的商業環境中,高效的倉庫管理對于企業的運營和成本控制至關重要。一個完善的倉庫管理系統能夠幫助企業實現貨物的精準存儲、快速出入庫、實時庫存監控以及全面的數據分析,從而提升整體運營效率、降低庫存成本、增強客戶…

【王陽明代數】熱門問答,什么是張量?

【王陽明代數】熱門問答,什么是張量? 流形學習基礎概念前情提要,張量概念的提出,王船山流形與信息容量的概念回答:什么是張量前,對王船山流形,意氣實體的定義再表述;王船山流形分析1…

差分壓縮算法(增量更新)

差分壓縮算法是一種數據壓縮技術,它的核心思想是通過找出數據之間的差異來減少需要存儲或傳輸的數據量。下面從基本原理、常見應用場景、算法示例等方面詳細介紹差分壓縮算法。 基本原理 差分壓縮算法的基本原理是比較相鄰數據元素之間的差異,并只記錄…

Html5支持的視頻文件格式和音頻文件格式有哪些?

視頻文件格式 MP4:MPEG-4 Part 14,支持H.264編碼。幾乎所有的瀏覽器都支持該格式。 WebM:谷歌開發的格式,使用VP8或VP9編碼,可以在大多數現代瀏覽器中播放 Ogg:開放媒體格式,使用Vorbis編碼&…

J20250704 算法題5道

題目一覽: 606. 根據二叉樹創建字符串 - 力扣(LeetCode) 506. 相對名次 - 力扣(LeetCode) 1. 兩數之和 - 力扣(LeetCode) 100. 相同的樹 - 力扣(LeetCode) 101. 對稱…

UNet改進(15):分組注意力機制在UNet中的應用探索

引言 注意力機制已成為現代深度學習架構中不可或缺的組成部分,特別是在計算機視覺領域。近年來,各種注意力機制的變體被提出,以解決不同場景下的特定問題。本文將深入探討一種稱為分組注意力(Grouped Attention)的機制,以及它如何被集成到經典的UNet架構中,從而提升模型在…

C++之路:類基礎、構造析構、拷貝構造函數

目錄 前言從結構體到類類的聲明與使用基礎聲明繼承聲明數據與函數聲明與調用聲明調用 類的訪問修飾符類對象的內存分布類內數據相關靜態變量非靜態變量 類成員函數相關普通成員函數友元函數構造與析構函數構造函數析構函數 拷貝構造函數總結 前言 面向對象編程有三大特性&#…

黑神話悟空游戲輿情分析

完整項目包點擊文末名片 黑神話悟空上線初期輿情分析 背景 《黑神話:悟空》在上線首日便創下了全球游戲行業的多項新紀錄,包括Steam同時在線人數超過222萬,全渠道總銷量超過450萬份,總銷售額超過15億元。本項目旨在對 3A 游戲《黑…

python的or-tools算法踩坑

debug模式代碼好的,然后正常運行不行(用的PyCharm) 不知道為什么debug模式這個可以的,但是正常模式不行 用or-tools算路徑的時候 因為要多次到達同一個點,但是or-tools不支持,所以弄了虛擬點和真實點的距離是0,但是實際上如果虛擬點到真實點為0的話or-tools結果秒出,但是實…

docker-compose一鍵部署全棧項目。springboot后端,react前端

部署總覽前端打包: 我們將配置 package.json,使用 npm run build (內部調用 vite build) 來打包。這個過程將完全在 Docker 構建鏡像的過程中自動完成,你的主機上甚至不需要安裝 Node.js。后端打包: 我們將配置 pom.xml,使用 mvn clean packa…

MCMC:高維概率采樣的“隨機游走”藝術

MCMC(馬爾可夫鏈蒙特卡洛) 是一種從復雜概率分布中高效采樣的核心算法,它解決了傳統采樣方法在高維空間中的“維度災難”問題。以下是其技術本質、關鍵算法及實踐的深度解析: 本文由「大千AI助手」原創發布,專注用真話…

HarmonyOS免密認證方案 助力應用登錄安全升級

6月21日,2025年華為開發者大會"安全與隱私分論壇"在松山湖順利舉辦。本論壇聚焦App治理與監管、星盾安全2.0的核心能力等進行深度分享與探討。其中,HarmonyOS Passkey免密認證方案作為安全技術創新成果備受矚目。該方案基于FIDO協議實現&#…

flutter flutter_vlc_player播放視頻設置循環播放失效、初始化后獲取不到視頻寬高

插件:flutter_vlc_player: ^7.4.3 問題1:設置循環播放_controller.setLooping(true);無用。 解決方法: //vlcPlayer設置循環播放失效,以這種方式失效循環播放 _setLoopListener() async {if (_videoController!.value.hasError…

React與Vue的主要區別

React和Vue都是當今最流行、最強大的前端Javascript框架,它們都能構建出色的單頁面應用。 以下是React和Vue的主要區別: React: React官方自稱是一個用于構建用戶界面的JavaScript庫(尤其是UI組件)。它專注于視圖層。…

瀏覽器原生控件上傳PDF導致hash值不同

用戶要求對上傳的pdf計算hash排重,上線后發現排重失敗 1、postman直接調用接口沒有發現問題,每次獲取的hash值是一樣的 2、apifox網頁版,調用接口發現問題,清除緩存后(將選擇的文件刪除重新選擇)&#xf…

.net 的依賴注入

依賴注入(Dependency Injection,簡稱 DI)是一種軟件設計模式,旨在將對象之間的依賴關系從代碼內部解耦出來,通過外部提供的方式來建立依賴關系,從而提高軟件的可維護性、可測試性和可擴展性。以下從概念、工作原理、常見類型、在不同框架中的應用等方面進行詳細解釋: 概…

【unitrix】 4.17 類型級別右移運算實現解析(shr.rs)

一、源碼 這段代碼實現了類型級別的右移運算(>>),包括對整數和定點數的支持。 /*類型級別的右移運算實現* 編制人: $ource* 修改版次:0版完成版* 本版次創建時間: 2025年6月27日* 最后修改時間: 2025年7月2日 Sub1修改* 待完善問題&a…

Java 并發核心:AQS(AbstractQueuedSynchronizer) 詳解

一、什么是 AQS? AbstractQueuedSynchronizer(簡稱 AQS)是 Java 并發包 java.util.concurrent.locks 中的一個核心同步框架,用于構建鎖和同步器,如: ReentrantLockReentrantReadWriteLockCountDownLatchS…

LoRA 實戰指南:NLP 與 CV 場景的高效微調方法全解析

大模型已成 AI 應用的“標配”,但高昂的訓練和部署成本讓很多企業望而卻步。LoRA(Low-Rank Adaptation)作為一種輕量級微調方案,正成為 NLP 與 CV 場景中低成本定制的利器。本文詳細通過詳細介紹 LoRA 的核心原理、在文本與圖像任…