結合了傳統因果推斷與機器學習的因果機器學習是目前AI+領域的前沿研究方向,其核心優勢在于將因果邏輯融入數據驅動模型,從根本上解決了傳統方法的缺陷。因此,它也是突破傳統機器學習瓶頸的關鍵方向,不僅當下熱度高,在未來幾年仍會是研究熱點。
今年,我們關于因果機器學習的創新可圍繞動態建模、高維數據處理、無監督學習與跨領域應用這些方面展開,比如結合深度學習與稀疏因果圖,開發輕量化混雜控制方法...既有理論深度又有實際價值,故事編好發高區問題不大。
當然,還是建議大家多關注頂會頂刊中相關的最新工作,結合一些具體領域(比如醫療)來展開。我這邊整理好了12篇因果機器學習最新論文,大家需要參考的可直接領取。
全部論文+開源代碼需要的同學看文末
Inferring heterogeneous treatment effects of crashes on highway traffic: A doubly robust causal machine learning approach
方法:本文提出了一種新穎的因果機器學習框架,通過Doubly Robust Learning方法估計交通事故對高速公路車速的異質性因果效應,解決了因果效應估計中的選擇偏差和變量選擇問題。
創新點:
-
提出了一個新的因果機器學習框架,用于估計不同類型交通事故對高速公路速度的異質因果效應。
-
基于因果圖理論,提出了條件Shapley值指數(CSVI),用于篩選不利變量,從而提高因果效應估計的精度和可靠性。
-
為應對缺乏反事實數據的問題,設計了一種匹配算法以選擇“反事實結果”,用于計算誤差指標。
Causal machine learning for predicting treatment outcomes
方法:論文探討了因果機器學習在個性化醫療中的潛力,通過從真實世界數據中估計治療效果,彌補傳統隨機對照試驗的不足,其方法論上的創新為個性化治療決策提供了重要的理論框架和實踐路徑。
創新點:
-
因果機器學習(Causal ML)提供了一種靈活的數據驅動方法,用于估計個體化治療效果。
-
因果ML能夠有效捕捉復雜疾病動態和人類病理生理及藥理學中的非線性關系。
Machine learning in causal inference for epidemiology
方法:文章討論了因果推斷中機器學習的應用,特別是如何將機器學習技術與傳統的因果推斷方法相結合,以解決流行病學研究中的因果效應估計問題,基于監督學習和雙重穩健估計等理論框架,采用訓練、驗證及測試階段的ML模型開發和評估方法。
創新點:
-
提出了一種結合機器學習與因果推斷的雙重穩健估計方法。
-
開發了一種TMLE的擴展形式,稱為TMLE-VIM,用于降維和變量重要性測量。
-
在雙重機器學習(DML)框架中,作者引入了樣本分割與交叉擬合技術。
Nature versus nurture in galaxy formation: the effect of environment on star formation with causal machine learning
方法:論文應用因果機器學習模型研究星系形成和演化過程中自然(內部過程)與養育(外部過程)的作用,通過構建復雜的因果模型和使用流行病學的先進方法,解決了長期以來的自然和養育角色分離問題,為理解星系演化提供了一個新的框架。
創新點:
-
通過構建復雜的因果模型來探討星系形成和演化中的“自然”與“養育”之間的關系。
-
通過引入基于逆概率加權(IPW)和邊緣結構模型(MSM)的技術,作者成功地在高維數據中消除了混雜偏差,準確估計了環境對星系形成率(SFR)的因果效應。
關注下方《學姐帶你玩AI》🚀🚀🚀
回復“因果機器”獲取全部方案+開源代碼
碼字不易,歡迎大家點贊評論收藏