兩階段最小二乘法(2SLS)與 工具變量(IV)模型

以下是關于兩階段最小二乘法(2SLS)工具變量(IV)模型關系的系統解析,結合計量經濟學理論與論文上下文進行說明:


一、核心關系:2SLS是IV模型的實現方法

1. IV模型:解決內生性的理論框架
  • 目標:估計存在內生性問題的回歸模型 yi=xi′β+uiy_i = x_i'\beta + u_iyi?=xi?β+ui?cov(xi,ui)≠0\text{cov}(x_i, u_i) \neq 0cov(xi?,ui?)=0)。
  • 工具變量要求
    • 相關性cov(zi,xi)≠0\text{cov}(z_i, x_i) \neq 0cov(zi?,xi?)=0
    • 外生性cov(zi,ui)=0\text{cov}(z_i, u_i) = 0cov(zi?,ui?)=0
  • 理論解:IV估計量 β^IV=(Z′X)?1Z′y\hat{\beta}_{IV} = (Z'X)^{-1}Z'yβ^?IV?=(ZX)?1Zy(僅適用于 dz=dβd_z = d_\betadz?=dβ? 的恰好識別場景)。
2. 2SLS:IV模型的普適性算法
  • 作用:將IV估計推廣到 dz>dβd_z > d_\betadz?>dβ?(過度識別)場景。
  • 本質:通過兩階段回歸數值等價于IV估計的廣義形式:
    β^2SLS=[X′Z(Z′Z)?1Z′X]?1X′Z(Z′Z)?1Z′y \hat{\beta}_{2SLS} = [X'Z(Z'Z)^{-1}Z'X]^{-1}X'Z(Z'Z)^{-1}Z'y β^?2SLS?=[XZ(ZZ)?1ZX]?1XZ(ZZ)?1Zy
  • 關鍵結論
    2SLS是IV模型的估計方法,當工具變量數=參數數(dz=dβd_z = d_\betadz?=dβ?)時,2SLS退化為標準IV估計。

二、2SLS的兩階段本質

1. 第一階段:凈化內生變量
  • 目標:分離 xix_ixi? 中與工具變量 ziz_izi? 相關的部分(外生成分)。
  • 操作
    回歸:xi=zi′δ+vi?????x^i=zi′δ^ \text{回歸:} \quad x_i = z_i'\delta + v_i \implies \hat{x}_i = z_i'\hat{\delta} 回歸:xi?=zi?δ+vi??x^i?=zi?δ^
  • 數學意義x^i\hat{x}_ix^i?xix_ixi? 在工具變量空間上的投影(X^=Z(Z′Z)?1Z′X\hat{X} = Z(Z'Z)^{-1}Z'XX^=Z(ZZ)?1ZX)。
2. 第二階段:替代回歸
  • 目標:用“凈化”后的 x^i\hat{x}_ix^i? 替代原始內生變量 xix_ixi?
  • 操作
    回歸:yi=x^i′β+εi?????β^2SLS=(X^′X^)?1X^′y \text{回歸:} \quad y_i = \hat{x}_i'\beta + \varepsilon_i \implies \hat{\beta}_{2SLS} = (\hat{X}'\hat{X})^{-1}\hat{X}'y 回歸:yi?=x^i?β+εi??β^?2SLS?=(X^X^)?1X^y
  • 直觀理解
    通過工具變量 ziz_izi? 提取 xix_ixi?外生變異,阻斷內生性傳遞路徑。

示例(教育回報率估計):

  • 第一階段:用出生季度(ziz_izi?)預測受教育年限(xix_ixi?
  • 第二階段:用預測的受教育年限(x^i\hat{x}_ix^i?)估計工資方程

三、2SLS與IV模型的數學等價性

1. 恰好識別場景(dz=dβd_z = d_\betadz?=dβ?
  • 2SLS第二階段
    β^2SLS=(X^′X^)?1X^′y \hat{\beta}_{2SLS} = (\hat{X}'\hat{X})^{-1}\hat{X}'y β^?2SLS?=(X^X^)?1X^y
  • 代入 X^=Z(Z′Z)?1Z′X\hat{X} = Z(Z'Z)^{-1}Z'XX^=Z(ZZ)?1ZX
    β^2SLS=[X′Z(Z′Z)?1Z′X]?1X′Z(Z′Z)?1Z′y \hat{\beta}_{2SLS} = [X'Z(Z'Z)^{-1}Z'X]^{-1}X'Z(Z'Z)^{-1}Z'y β^?2SLS?=[XZ(ZZ)?1ZX]?1XZ(ZZ)?1Zy
  • 標準IV估計量
    β^IV=(Z′X)?1Z′y(當?dz=dβ?時等價) \hat{\beta}_{IV} = (Z'X)^{-1}Z'y \quad \text{(當 } d_z = d_\beta \text{ 時等價)} β^?IV?=(ZX)?1Zy(當?dz?=dβ??時等價)
2. 過度識別場景(dz>dβd_z > d_\betadz?>dβ?
  • 2SLS優勢:自動處理多余工具變量,仍可計算唯一解。
  • IV模型擴展:需結合GMM框架最小化加權矩條件(如論文中的SGMM)。

四、論文中的技術定位

1. 2SLS作為基準方法
  • 對比角色:論文以離線2SLS為基準,凸顯SGMM的在線計算優勢(見表1-2)。
  • 局限場景
    • 2SLS無法直接處理流數據(需全樣本存儲)
    • 2SLS在過度識別時統計效率非最優(未使用GMM加權)
2. SGMM對2SLS的改進
維度2SLSSGMM(本文)
數據模式批處理(離線)流數據(在線)
計算復雜度O(ndz2)O(n d_z^2)O(ndz2?)(矩陣求逆)O(dz2)O(d_z^2)O(dz2?) 每樣本(增量更新)
過度識別直接可用但非最優動態優化權重矩陣 WiW_iWi?
理論性質一致但漸近方差非最小漸近等價于最優GMM

五、關鍵概念辨析

術語定義與2SLS的關系
工具變量(IV)滿足相關性、外生性的變量 ziz_izi?2SLS的實現基礎
IV模型結構方程 yi=xi′β+uiy_i = x_i'\beta + u_iyi?=xi?β+ui? + 矩條件 E[uizi]=0\mathbb{E}[u_i z_i] = 0E[ui?zi?]=02SLS估計的對象
2SLS通過兩階段回歸求解IV模型的算法IV模型的估計器
GMM最小化加權矩條件 min?βgn(β)′Wngn(β)\min_\beta g_n(\beta)'W_n g_n(\beta)minβ?gn?(β)Wn?gn?(β)2SLS的推廣(含最優加權)

總結

  • IV模型是解決內生性問題的理論框架,2SLS是其最常用的估計算法
  • 2SLS通過兩階段回歸數值實現IV估計:第一階段提取內生變量的外生成分,第二階段進行無偏回歸。
  • 論文中,2SLS作為離線基準,而SGMM通過隨機近似框架將其擴展至流數據場景,實現高效在線估計。

核心公式回顧
2SLS估計量:
β^2SLS=[X′Z(Z′Z)?1Z′X]?1?工具投影X′Z(Z′Z)?1Z′y?工具加權 \hat{\beta}_{2SLS} = \color{red}{\underbrace{[X'Z(Z'Z)^{-1}Z'X]^{-1}}_{\text{工具投影}}} \color{blue}{\underbrace{X'Z(Z'Z)^{-1}Z'y}_{\text{工具加權}}} β^?2SLS?=工具投影[XZ(ZZ)?1ZX]?1??工具加權XZ(ZZ)?1Zy??
紅色部分:工具變量對解釋變量的投影
藍色部分:工具變量對因變量的加權

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/93141.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/93141.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/93141.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

熬夜面膜賽道跑出的新物種

在快節奏的現代生活中,熬夜已成為都市人群的常態,深夜11點后的朋友圈總是一片“失眠”哀嚎。隨之而來的是“熬夜肌”問題的激增——暗沉、干燥、屏障受損等訴求催生了龐大的熬夜面膜市場。2025年,中國面膜線上規模已達484億元,其中…

20250813測試開發崗(涼)面

1. 自我介紹2. 你如何理解測開,你認為測開的工作有哪些3. 測試的時候包括哪些部分4. 就功能層面,你認為需要從那些部分考慮,形成一個完整并可執行的trace(是這個詞吧)5. 你了解數據庫嗎(我說只會比較基礎的…

面向Python/C#開發者入門Java與Bukkit API

本教程將以"手持發射器箭矢機槍"功能為例,帶你掌握Java語言基礎和Bukkit API的核心概念,最終實現自主開發插件。 我們將通過剖析一個實際Java代碼文件,逐步解析其運作機制,幫助你順利將現有編程知識遷移到Java和Bukkit…

從100到0.3美元:GPT-5用價格戰血洗大模型賽道

————————— 一、從 100 美元到 0.3 美元:史無前例的效率革命 ————————— 互聯網女王 Mary Meeker 在《AI 趨勢報告 2025》里寫下這組數字: ? 訓練成本 8 年飆升 2400 倍; ? 推理成本 2 年暴跌 99.7%。OpenAI 把“暴跌”推到…

第三十二天(文件操作安全)

文件遍歷上傳下載刪除編輯包含等 $_FILES:PHP中一個預定義的超全局變量,用于在上傳文件時從客戶端接收文件,并將其保存到服務器上。它是一個包含上傳文件信息的數組,包括文件名、類型、大小、臨時文件名等信息。 $_FILES"表…

系統集成項目管理工程師【第十一章 規劃過程組】規劃風險應對、規劃采購管理篇

系統集成項目管理工程師【第十一章 規劃過程組】規劃風險應對、規劃采購管理篇 一、規劃風險應對:為項目穿上"防護衣" 1. 什么是規劃風險應對? 規劃風險應對是基于風險量化分析結果,制定可選方案、選擇應對策略并商定具體行動的過程…

20250813比賽總結

題目T1.volumeT2.storyT3.treeT4.game預計分數6060030實際分數306000T1.volume 確實是暴力,但我是用數組統計每個可能出現的數,于是3AC 3WA 4TLE。拿到全部分應該直接按照題目模擬。 T2.story 暴力dfs,由于忘記優化所以60pts,而且…

適合物流/應急/工業的對講機,AORO M6 Pro構建高效指揮調度方案

在物流調度、應急救援與工業協同等對通信可靠性要求極高的領域中,專業對講設備的技術迭代直接關系到任務執行效率與安全保障。AORO M6 Pro對講機作為新一代融合通信終端,正以多模融合技術與國產化自主創新,為復雜場景下的高效調度提供堅實的技…

類和對象----中

這里寫目錄標題<font color"#FF00FF">1. 類和對象(中)<font color"#FF00FF">2. 構造函數<font color"#FF00FF">3. 析構函數<font color"#FF00FF">4. 拷?構造函數1. 類和對象(中) 類的默認成員函數&#xff1…

CAD 的 C# 開發中,對多段線(封閉多邊形)內部的點進行 “一筆連線且不交叉、不出界

本質上是約束條件下的路徑規劃問題&#xff0c;核心是找到一條連續路徑遍歷所有點&#xff0c;同時滿足&#xff1a; 路徑不與自身交叉&#xff1b; 路徑全程在多段線&#xff08;多邊形&#xff09;內部&#xff1b; 路徑連續&#xff08;一筆畫&#xff09;。核心思路與算法步…

ZED 2i相機調試

1. 測試 ZED SDK /usr/local/zed/tools/ZED_Diagnostic/usr/local/zed/tools/ZED_Explorer2. 安裝SDK How to Install ZED SDK on Linux - Stereolabs 安裝命令&#xff1a; sudo apt install zstd./ZED_SDK_Ubuntu20_cuda12.1_tensorrt8.6_v5.0.5.zstd.run

Go語言select并發編程實戰指南

一、select作用Go 語言中的 select 語句是處理多通道&#xff08;Channel&#xff09;操作的核心控制結構&#xff0c;專為高效并發通信而設計。通過巧妙運用 select 語句&#xff0c;開發者能夠高效實現并發控制、超時處理和非阻塞通信等功能&#xff0c;使其成為 Go 語言并發…

OpenCV常見問題匯總

1、深度拷貝的問題我對整張圖像通過裁剪分別進行識別&#xff0c;出現識別結果與期望不同的問題&#xff0c;經過大量排查是OpenCV深度拷貝問題&#xff0c;我原來有問題的寫法cv::Mat matCrop matZoom(roi); cv::Mat matCrop1 matCrop(roi1); cv::Mat matCrop2 matCrop(roi2)…

【Unity開發】Unity核心學習(一)

一、2D相關1、圖片導入相關設置 &#xff08;1&#xff09;Unity支持的圖片格式 支持BMP、TIF、JPG、PNG、TGA、PSD 常用格式具體介紹&#xff1a; JPG&#xff1a;指JPGE格式&#xff0c;屬于有損壓縮格式&#xff0c;無透明通道 PNG&#xff1a;無損壓縮格式&#xff0c;有透…

Python自定義異常類的寫法與使用場景

在軟件開發的生命周期中&#xff0c;異常處理是保障程序健壯性與可維護性的關鍵環節。Python作為一門高級編程語言&#xff0c;內置了豐富的異常機制&#xff0c;能夠高效、優雅地應對運行時的各種錯誤。然而&#xff0c;面對復雜業務場景和多層架構時&#xff0c;內置異常往往…

為 Promethus 配置https訪問

一、序言 本篇將介紹如何使用數字證書為Promethus 訪問提供加密功能&#xff0c;由于是實驗環境證書由openssl生成&#xff0c;操作指南來自官網手冊&#xff1a;https://prometheus.io/docs/guides/tls-encryption/在生產環境中prometheus可能會放在后端&#xff0c;證書一般配…

擺脫例行 SQL 報表的隱性成本:用 n8n 構建四節點自動化報告流程

例行 SQL 報表的隱藏成本 各類組織的數據團隊都面臨同樣的反復難題:利益相關方需要定期報告,但手工 SQL 報表占用了本可用于分析的寶貴時間。無論公司規模如何,流程幾乎一致——連接數據庫、執行查詢、格式化結果,并將結論分發給決策者。 數據從業者經常要處理并不需要高…

HCIP——OSPF綜合實驗

一、實驗拓撲二、實驗要求1、R4為ISP&#xff0c;其上只配置IP地址&#xff1b;R4與其他所直連設備間均使用公有IP&#xff1b; 2、R3-R5、R6、R7為MGRE環境&#xff0c;R3為中心站點&#xff1b; 3、整個OSPF環境IP基于172.16.0.0/16劃分&#xff1b;除了R12有兩個環回&#x…

GitHub 趨勢日報 (2025年08月12日)

&#x1f4ca; 由 TrendForge 系統生成 | &#x1f310; https://trendforge.devlive.org/ &#x1f310; 本日報中的項目描述已自動翻譯為中文 &#x1f4c8; 今日獲星趨勢圖 今日獲星趨勢圖1397gpt4all442system-prompts-and-models-of-ai-tools331umami307full-stack-fast…

Linux網絡性能調優終極指南:深度解析與實踐

Linux網絡性能調優終極指南&#xff1a;深度解析與實踐 一、性能調優核心原理體系 1.1 數據包生命周期與性能瓶頸 #mermaid-svg-TsvnmiGx1WeTerK2 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-TsvnmiGx1WeTerK2 .…