Double/Debiased Machine Learning

獨立同步分布的觀測數據 { W i = ( Y i , D i , X i ) ∣ i ∈ { 1 , . . . , n } } \{W_i=(Y_i,D_i,X_i)| i\in \{1,...,n\}\} {Wi?=(Yi?,Di?,Xi?)i{1,...,n}},其中 Y i Y_i Yi?表示結果變量, D i D_i Di?表示因變量, X i X_i Xi?表示控制變量。

目標參數 θ 0 \theta_0 θ0?的一般定義形式為:

E [ m ( W ; θ 0 , η 0 ) ] = 0 E[m(W;\theta_0,\eta_0)] = 0 E[m(W;θ0?,η0?)]=0

W W W為觀測到的變量, θ 0 ∈ Θ \theta_0\in \Theta θ0?Θ為目標參數, η 0 ∈ T \eta_0\in \mathcal{T} η0?T為輔助參數

例如,ATE 的定義為:

θ 0 A T E ≡ E [ E [ Y i ∣ D i = 1 , X i ] ? E [ Y i ∣ D i = 0 , X i ] ] \theta_0^{ATE}\equiv E[E[Y_i|D_i=1,X_i] - E[Y_i|D_i=0,X_i]] θ0ATE?E[E[Yi?Di?=1,Xi?]?E[Yi?Di?=0,Xi?]]

ATE的IPW估計定義為:

m I P W ( W i ; θ , α ) ≡ α ( D i , X i ) Y i ? θ ≡ [ D i E [ D i ∣ X i ] ? 1 ? D i 1 ? E [ D i ∣ X i ] ] Y i ? θ m_{IPW}(W_i;\theta,\alpha)\equiv \alpha(D_i,X_i)Y_i - \theta \equiv [\frac{D_i}{E[D_i|X_i]} - \frac{1-D_i}{1-E[D_i|X_i]}]Y_i - \theta mIPW?(Wi?;θ,α)α(Di?,Xi?)Yi??θ[E[Di?Xi?]Di???1?E[Di?Xi?]1?Di??]Yi??θ

ATE的Doubly Robust估計的定義為:

m D R ( W i ; θ , η ) ≡ α ( D i , X i ) ( Y i ? E [ Y i ∣ D i , X i ] ) Y i + E [ Y i ∣ D i = 1 , X i ] ? E [ Y i ∣ D i = 0 , X i ] ? θ m_{DR}(W_i;\theta,\eta)\equiv \alpha(D_i,X_i)(Y_i - E[Y_i|D_i,X_i])Y_i + E[Y_i|D_i=1,X_i]- E[Y_i|D_i=0,X_i]-\theta mDR?(Wi?;θ,η)α(Di?,Xi?)(Yi??E[Yi?Di?,Xi?])Yi?+E[Yi?Di?=1,Xi?]?E[Yi?Di?=0,Xi?]?θ

≡ [ D i E [ D i ∣ X i ] ? 1 ? D i 1 ? E [ D i ∣ X i ] ] Y i + E [ Y i ∣ D i = 1 , X i ] ? E [ Y i ∣ D i = 0 , X i ] ? θ \equiv [\frac{D_i}{E[D_i|X_i]} - \frac{1-D_i}{1-E[D_i|X_i]}] Y_i + E[Y_i|D_i=1,X_i]- E[Y_i|D_i=0,X_i]-\theta [E[Di?Xi?]Di???1?E[Di?Xi?]1?Di??]Yi?+E[Yi?Di?=1,Xi?]?E[Yi?Di?=0,Xi?]?θ

一般情況下,目標參數 θ 0 \theta_0 θ0?的估計值定義為:

θ ^ : 1 n ∑ i = 1 n m ( W i ; θ ^ , η ^ ) = 0 \hat{\theta}:\frac{1}{n}\sum_{i=1}^nm(W_i;\hat{\theta},\hat{\eta}) = 0 θ^:n1?i=1n?m(Wi?;θ^,η^?)=0

一階泰勒展得出:

1 n ∑ i = 1 n m ( W i ; θ ^ , η ^ ) ≈ 1 n ∑ i = 1 n m ( W i ; θ 0 , η 0 ) + 1 n ∑ i = 1 n ? ? θ m ( W i ; θ 0 , η 0 ) ( θ ^ ? θ 0 ) + 1 n ∑ i = 1 n ? ? η m ( W i ; θ 0 , η 0 ) ( η ^ ? η 0 ) ≈ 0 \frac{1}{n}\sum_{i=1}^nm(W_i;\hat{\theta},\hat{\eta}) \approx \frac{1}{n}\sum_{i=1}^nm(W_i;\theta_0,\eta_0) + \frac{1}{n}\sum_{i=1}^n\frac{\partial}{\partial\theta}m(W_i;\theta_0,\eta_0)(\hat{\theta} - \theta_0) + \frac{1}{n}\sum_{i=1}^n\frac{\partial}{\partial\eta}m(W_i;\theta_0,\eta_0)(\hat{\eta} - \eta_0) \approx 0 n1?i=1n?m(Wi?;θ^,η^?)n1?i=1n?m(Wi?;θ0?,η0?)+n1?i=1n??θ??m(Wi?;θ0?,η0?)(θ^?θ0?)+n1?i=1n??η??m(Wi?;θ0?,η0?)(η^??η0?)0

( θ 0 ? θ ^ ) ≈ [ 1 n ∑ i = 1 n ? ? θ m ( W i ; θ 0 , η 0 ) ] ? 1 1 n ∑ i = 1 n m ( W i ; θ 0 , η 0 ) + [ 1 n ∑ i = 1 n ? ? θ m ( W i ; θ 0 , η 0 ) ] ? 1 ( η ^ ? η 0 ) 1 n ∑ i = 1 n ? ? η m ( W i ; θ 0 , η 0 ) (\theta_0 - \hat{\theta})\approx [\frac{1}{n}\sum_{i=1}^n\frac{\partial}{\partial\theta}m(W_i;\theta_0,\eta_0)]^{-1}\frac{1}{n}\sum_{i=1}^nm(W_i;\theta_0,\eta_0) + [\frac{1}{n}\sum_{i=1}^n\frac{\partial}{\partial\theta}m(W_i;\theta_0,\eta_0)]^{-1}(\hat{\eta} - \eta_0)\frac{1}{n}\sum_{i=1}^n\frac{\partial}{\partial\eta}m(W_i;\theta_0,\eta_0) (θ0??θ^)[n1?i=1n??θ??m(Wi?;θ0?,η0?)]?1n1?i=1n?m(Wi?;θ0?,η0?)+[n1?i=1n??θ??m(Wi?;θ0?,η0?)]?1(η^??η0?)n1?i=1n??η??m(Wi?;θ0?,η0?)

目標參數的估計偏差 ( θ 0 ? θ ^ ) (\theta_0 - \hat{\theta}) (θ0??θ^)將受到輔助參數估計偏差 ( η ^ ? η 0 ) (\hat{\eta} - \eta_0) (η^??η0?)的影響,說明目標參數的估計偏差的兩種來源分別是:

  • 輔助參數的估計偏差 ( η ^ ? η 0 ) (\hat{\eta} - \eta_0) (η^??η0?)本身,稱之為正則化偏差
  • 輔助參數的估計偏差 ( η ^ ? η 0 ) (\hat{\eta} - \eta_0) (η^??η0?) W i W_i Wi?的強相關性,稱之為過擬合偏差

Neyman Orthogonality

? ? λ { E [ ψ ( W i ; θ 0 , η 0 + λ ( η ? η 0 ) ) ] } ∣ λ = 0 = 0 , ? η ∈ T \frac{\partial}{\partial\lambda}\{E[\psi(W_i;\theta_0,\eta_0 + \lambda(\eta-\eta_0))]\}|_{\lambda=0}= 0,\forall\eta\in \mathcal{T} ?λ??{E[ψ(Wi?;θ0?,η0?+λ(η?η0?))]}λ=0?=0,?ηT

m I P W m_{IPW} mIPW? is not Neyman orthogonal, m D R m_{DR} mDR? is Neyman orthogonal.

Cross Fitting

θ ^ : 1 n ∑ k = 1 K ∑ i ∈ I k m ( W i ; θ ^ , η ^ ? k ) = 0 \hat{\theta}:\frac{1}{n}\sum_{k=1}^K\sum_{i\in I_k}m(W_i;\hat{\theta},\hat{\eta}_{-k}) = 0 θ^:n1?k=1K?iIk??m(Wi?;θ^,η^??k?)=0

DML

θ ^ : 1 n ∑ k = 1 K ∑ i ∈ I k ψ ( W i ; θ ^ , η ^ ? k ) = 0 \hat{\theta}:\frac{1}{n}\sum_{k=1}^K\sum_{i\in I_k}\psi(W_i;\hat{\theta},\hat{\eta}_{-k}) = 0 θ^:n1?k=1K?iIk??ψ(Wi?;θ^,η^??k?)=0

直接回歸不滿足 Neyman 正交性

Y = θ T + g ( X ) + ? Y = \theta T + g(X) + \epsilon Y=θT+g(X)+?

m ( W ; θ , g ) = Y ? θ T ? g ( X ) + ? m(W;\theta,g) = Y - \theta T - g(X) + \epsilon m(W;θ,g)=Y?θT?g(X)+?

? ? λ E [ m ( w ; θ , g + λ Δ g ) ] ∣ λ = 0 = E [ ? Δ g ( x ) ] ≠ 0 \frac{\partial }{\partial \lambda}E[m(w;\theta,g + \lambda\Delta g)]|_{\lambda=0} = E[-\Delta g(x)] \ne 0 ?λ??E[m(w;θ,g+λΔg)]λ=0?=E[?Δg(x)]=0

DML 滿足Neyman正交性

Y ? l ( x ) = θ ( T ? m ( x ) ) + ? ′ , l ( x ) = E [ Y ∣ X = x ] , m ( x ) = E [ T ∣ X = x ] Y-l(x) = \theta (T - m(x)) + \epsilon',l(x) = E[Y|X=x],m(x)=E[T|X=x] Y?l(x)=θ(T?m(x))+?,l(x)=E[YX=x],m(x)=E[TX=x]

m ( W ; θ , η ) = Y ? l ( x ) ? θ ( T ? m ( x ) ) ? ? ′ , η = ( l , m ) m(W;\theta,\eta) = Y-l(x) - \theta (T - m(x)) - \epsilon',\eta = (l, m) m(W;θ,η)=Y?l(x)?θ(T?m(x))??,η=(l,m)

? ? λ E [ W ; θ , η + λ Δ η ] ∣ λ = 0 = E [ ? Δ l ( x ) + θ Δ m ( x ) ] = 0 \frac{\partial}{\partial\lambda}E[W;\theta,\eta + \lambda\Delta\eta]|_{\lambda=0} = E[-\Delta l(x) + \theta\Delta m(x)] = 0 ?λ??E[W;θ,η+λΔη]λ=0?=E[?Δl(x)+θΔm(x)]=0

Example

模擬數據

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import math
import dowhy.datasets, dowhy.plotter
rvar = 1 if np.random.uniform() > 0.2 else 0
is_linear = False # A non-linear dataset. Change to True to see results for a linear dataset.
data_dict = dowhy.datasets.xy_dataset(10000, effect=rvar,num_common_causes=2,is_linear=is_linear,sd_error=0.2)
df = data_dict['df']
print(df.head())
dowhy.plotter.plot_treatment_outcome(df[data_dict["treatment_name"]], df[data_dict["outcome_name"]],df[data_dict["time_val"]])

請添加圖片描述

因果關系假設:

  • 基于領域知識提出因果關系的假設,定義模型結構
from dowhy import CausalModel
model= CausalModel(data=df,treatment=data_dict["treatment_name"],outcome=data_dict["outcome_name"],common_causes=data_dict["common_causes_names"],instruments=data_dict["instrument_names"])
model.view_model(layout="dot")

請添加圖片描述

因果關系識別:

identified_estimand = model.identify_effect(proceed_when_unidentifiable=True)
print(identified_estimand)

因果關系估計:

from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LassoCV
from sklearn.ensemble import GradientBoostingRegressor
dml_estimate = model.estimate_effect(identified_estimand, method_name="backdoor.econml.dml.DML",control_value = 0,treatment_value = 1,confidence_intervals=False,method_params={"init_params":{'model_y':GradientBoostingRegressor(),'model_t': GradientBoostingRegressor(),"model_final":LassoCV(fit_intercept=False),'featurizer':PolynomialFeatures(degree=2, include_bias=True)},"fit_params":{}})
print(dml_estimate)

因果關系反駁測試:

res_placebo=model.refute_estimate(identified_estimand, dml_estimate,method_name="placebo_treatment_refuter", placebo_type="permute",num_simulations=20)
print(res_placebo)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/83913.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/83913.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/83913.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Tailwind CSS 實戰:基于 Kooboo 構建 AI 對話框頁面(八):異步處理邏輯詳解

在現代 Web 應用中,異步處理是實現流暢交互的核心技術。本文基于前幾章實現的內容Tailwind CSS 實戰:基于 Kooboo 構建 AI 對話框頁面(七):消息框交互功能添加-CSDN博客,深入解析 AI 對話框頁面中異步邏輯的…

Asp.net Core 通過依賴注入的方式獲取用戶

思路:Web項目中,需要根據當前登陸的用戶,查詢當前用戶所屬的數據、添加并標識對象等。根據請求頭Authorization 中token,獲取Redis中存儲的用戶對象。 本做法需要完成 基于StackExchange.Redis 配置,參考:…

Vue3 + UniApp 藍牙連接與數據發送(穩定版)

本教程適用于使用 uni-app Vue3 (script setup) 開發的跨平臺 App(支持微信小程序、H5、Android/iOS 等) 🎯 功能目標 ? 獲取藍牙權限? 掃描周圍藍牙設備? 連接指定藍牙設備? 獲取服務和特征值? 向設備發送數據包(ArrayBu…

Docker + Nginx + Logrotate 日志管理與輪換實踐

概述與背景 Docker 容器化環境中 Nginx 日志管理的挑戰Logrotate 的作用與必要性結合場景的實際需求(如日志切割、壓縮、歸檔) Docker 環境下的 Nginx 日志配置 Nginx 日志路徑與 Docker 數據卷映射 volumes:- ./nginx/logs:/var/log/nginxLogrotate …

涂膠協作機器人解決方案 | Kinova Link 6 Cobot在涂膠工業的方案應用與價值

涂膠工業現狀背景: 涂膠工藝在汽車制造、電子組裝、航空航天等工業領域極為關鍵,關乎產品密封、防水、絕緣性能及外觀質量。 然而,傳統涂膠作業問題頻發。人工操作重復性強易疲勞,涂膠質量波動大;大型涂膠器使用增加工…

釋放模型潛力:淺談目標檢測微調技術(Fine-tuning)

引言 在計算機視覺領域,目標檢測是一項至關重要的任務,它不僅要識別出圖像中存在哪些物體,還要精確地定位它們的位置。從自動駕駛汽車識別行人與車輛,到醫療影像輔助診斷病灶,再到智能安防監控異常事件,目標…

Unreal從入門到精通之 UE4 vs UE5 VR性能優化實戰

文章目錄 前言:準備工作UE4 vs UE5 性能對比引擎核心技術方案對比UE5 優化總結項目設置可伸縮性組設置VolumetricCloud最后前言: 最近在使用UE5制作VR項目 制作完后發現,我們的場景一直很卡頓,場景優化也做到了極致,但是幀率最高也才30+ 但是我們看到一個競品,他的幀率竟…

爆炸仿真的學習日志

今天學習了一下【Workbench LS-DYNA中炸藥在空氣中爆炸的案例-嗶哩嗶哩】 https://b23.tv/kmXlN29 一開始 如果你的 ANSYS Workbench 工具箱(Toolbox)里 只有 SPEOS,即使嘗試了 右鍵刷新、重置視圖、顯示全部 等方法仍然沒有其他分析系統&a…

Redis部署架構詳解:原理、場景與最佳實踐

文章目錄 Redis部署架構詳解:原理、場景與最佳實踐單點部署架構原理適用場景優勢劣勢最佳實踐 主從復制架構原理消息同步機制1. 全量同步(Full Resynchronization)2. 部分重同步(Partial Resynchronization)3. 心跳檢測…

AI預測3D新模型百十個定位預測+膽碼預測+去和尾2025年6月6日第100彈

從今天開始,咱們還是暫時基于舊的模型進行預測,好了,廢話不多說,按照老辦法,重點8-9碼定位,配合三膽下1或下2,殺1-2個和尾,再殺4-5個和值,可以做到100-300注左右。 (1)定…

驗證電機理論與性能:電機試驗平板提升測試效率

電機試驗平板提升測試效率是驗證電機理論與性能的重要環節之一。通過在平板上進行電機試驗,可以對電機的性能參數進行準確測量和分析,從而驗證電機的理論設計是否符合實際表現。同時,提升測試效率可以加快試驗過程,節約時間和成本…

C語言 — 編譯和鏈接

目錄 1.程序從源文件到結果輸出的執行過程2.預處理3.編譯3.1 詞法分析3.2 語法分析3.3 語義分析3.4 生成test.s文件 4.匯編5.鏈接6.運行 1.程序從源文件到結果輸出的執行過程 2.預處理 預處理階段的執行操作: 預處理階段會將#define定義的常量或宏進行替換&#x…

傳統業務對接AI-AI編程框架-Rasa的業務應用實戰(5)--Rasa成型可用 rasa服務化部署及識別意圖后的決策及行為

此篇接續上一篇 傳統業務對接AI-AI編程框架-Rasa的業務應用實戰(4)--Rasa成型可用 針對業務配置rasa并訓練和部署 上一篇我們已經讓Rasa準確識別了我們自然語言指令的開票和查詢發票的意圖和實體。 # 開具發票場景 用戶輸入:開具一張1000元…

MajicTryOn(基于wanvideo的虛擬試穿項目)

網絡結構 Attention模塊詳解 左邊服裝通過qwen2.5-VL-7B來生成詳細的服裝描述;線條提取器產生相應的線條map;garment和line map通過vae轉換為潛在空間特征,然后分別經過patchfier,最后通過zero proj得到Garment Tokens和Line Tokens;右邊是di…

JAVA-什么是JDK?

1.JDK 的定義 JDK(Java Development Kit)是 Java 開發工具包,是 Oracle 官方提供的用于開發、編譯和運行 Java 應用程序的核心工具集。它包含了編寫 Java 程序所需的編譯器、調試工具、庫文件以及運行時環境(JRE)。 2…

Palo Alto Networks Expedition存在命令注入漏洞(CVE-2025-0107)

免責聲明 本文檔所述漏洞詳情及復現方法僅限用于合法授權的安全研究和學術教育用途。任何個人或組織不得利用本文內容從事未經許可的滲透測試、網絡攻擊或其他違法行為。使用者應確保其行為符合相關法律法規,并取得目標系統的明確授權。 對于因不當使用本文信息而造成的任何直…

分布式光纖傳感(DAS)技術應用解析:從原理到落地場景

近年來,分布式光纖傳感(Distributed Acoustic Sensing,DAS)技術正悄然改變著眾多傳統行業的感知方式。它將普通的通信光纜轉化為一個長距離、連續分布的“聽覺傳感器”,對振動、聲音等信號實現高精度、高靈敏度的監測。…

獨家首發!低照度環境下YOLOv8的增強方案——從理論到TensorRT部署

文章目錄 引言一、低照度圖像增強技術現狀1.1 傳統低照度增強方法局限性1.2 深度學習-based方法進展 二、Retinexformer網絡原理2.1 Retinex理論回顧2.2 Retinexformer創新架構2.2.1 光照感知Transformer2.2.2 多尺度Retinex分解2.2.3 自適應特征融合 三、YOLOv8-Retinexformer…

96. 2017年藍橋杯省賽 - Excel地址(困難)- 進制轉換

96. Excel地址(進制轉換) 1. 2017年藍橋杯省賽 - Excel地址(困難) 標簽:2017 省賽 1.1 題目描述 Excel 單元格的地址表示很有趣,它使用字母來表示列號。 比如, A 表示第 1 列,…

EtherNet/IP轉DeviceNet協議網關詳解

一,設備主要功能 疆鴻智能JH-DVN-EIP本產品是自主研發的一款EtherNet/IP從站功能的通訊網關。該產品主要功能是連接DeviceNet總線和EtherNet/IP網絡,本網關連接到EtherNet/IP總線中做為從站使用,連接到DeviceNet總線中做為從站使用。 在自動…