【Python實戰因果推斷】21_傾向分1

目錄

The Impact of Management Training

Adjusting with Regression


之前學習了如何使用線性回歸調整混雜因素。此外,還向您介紹了通過正交化去偏差的概念,這是目前最有用的偏差調整技術之一。不過,您還需要學習另一種技術--傾向加權。這種技術涉及對治療分配機制進行建模,并利用模型的預測對數據重新加權,而不是像正交化那樣建立殘差

本文內容更適合于有二元或離散干預的情況。不過,我還是會展示一種擴展方法,讓你可以將傾向加權用于連續干預。

The Impact of Management Training

科技公司的一個普遍現象是,有才華的個人貢獻者(IC)會向管理層發展。但是,由于管理層所需的技能往往與他們成為優秀個人貢獻者的技能大相徑庭,因此這種轉變往往絕非易事。不僅對新任管理者,而且對他們所管理的人員來說,都要付出高昂的個人代價。

一家大型跨國公司希望減少這種過渡的痛苦,決定投資對新任經理進行經理培訓。同時,為了衡量培訓的效果,該公司嘗試隨機挑選經理人參加這一項目。我們的想法是,比較那些經理參加了培訓的員工與那些經理沒有參加培訓的員工的敬業度得分。通過適當的隨機化,這種簡單的比較就能得出培訓的平均干預效果。

遺憾的是,事情并沒有那么簡單。有些經理不想參加培訓,就干脆不來了。還有一些人即使沒有被指定接受培訓,也設法接受了培訓。結果,本來是一項隨機研究,到頭來卻變成了觀察研究

現在,作為一名必須閱讀這些數據的分析師,你必須通過調整混雜因素,使治療和未治療的數據具有可比性。為此,你會得到有關公司經理的數據以及描述他們的一些協變量:

 import pandas as pdimport numpy as npdf = pd.read_csv("data/management_training.csv")df.head()

處理變量是intervention,您感興趣的結果是 engagement_score,即該經理的員工的平均標準化敬業度得分。除了干預和結果之外,該數據中的協變量還有

department_id?該部門的唯一標識符、
tenure?經理在公司工作的年限(作為一名員工,不一定是作為一名經理)
n_of_reports?經理所擁有的報告的數量
gender ?管理者性別分類變量
role?公司內部的工作類別
department_size ?同一部門的員工人數
department_score ?同一部門的平均參與度得分
last_engagement_score?該經理在上一輪敬業度調查中的平均敬業度得分
您希望通過控制部分或全部這些變量,在估計管理培訓與員工敬業度之間的因果關系時,可以設法減少甚至消除偏差。

Adjusting with Regression

在進行傾向加權之前,我們先用回歸法來調整混雜因素。一般來說,在學習新知識時,最好能有一些值得信賴的基準進行比較。這里的想法是檢查傾向加權估計值是否至少與回歸估計值一致。現在,讓我們開始吧。

首先,如果只是比較治療組和對照組,您會得到以下結果:

 import statsmodels.formula.api as smfsmf.ols("engagement_score ~ intervention",data=df).fit().summary().tables[1]

但話說回來,這個結果很可能是有偏差的,因為干預并非完全隨機。為了減少這種偏差,您可以根據數據中的協變量進行調整,估計出以下模型:

engagement_i=\tau T_i+\theta X_i+e_i,

其中,X 為所有混雜因素,加上一列常數作為截距。此外,性別和角色都是分類變量,因此您必須在 OLS 公式中用 C() 將它們包起來:

 model = smf.ols("""engagement_score ~ intervention + tenure + last_engagement_score + department_score+ n_of_reports + C(gender) + C(role)""", data=df).fit()print("ATE:", model.params["intervention"])print("95% CI:", model.conf_int().loc["intervention", :].values.T)ATE: 0.267790857667685695% CI: [0.23357751 0.30200421]

請注意,這里的效果估計值比您之前得到的效果估計值要小得多。這在一定程度上表明存在正偏差,即員工參與度已經較高的經理更有可能參加了經理培訓項目。好了,前言到此為止。讓我們來看看傾向加權是怎么回事。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/39850.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/39850.shtml
英文地址,請注明出處:http://en.pswp.cn/web/39850.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Ionic 卡片:設計和使用指南

Ionic 卡片:設計和使用指南 Ionic 是一個強大的開源框架,用于構建跨平臺的移動應用程序。它結合了 Angular、React 和 Vue 的強大功能,允許開發者使用 Web 技術創建高性能的移動應用。Ionic 卡片是框架中的一個核心組件,用于展示…

js使用插件完成xml轉json

插件&#xff1a;xml2json.min.js 插件文件下載&#xff08;不能上傳附件&#xff09;&#xff1a;https://download.csdn.net/download/zhu_zhu_xia/89513965 html代碼&#xff1a; <!DOCTYPE html> <html lang"en"><head><meta charset&qu…

我認為一般信息管理應用中使用存儲過程高效

總看有些人反對使用存儲過程&#xff0c;原因無非是以下幾點 1.不利于更換數據庫&#xff0c;就是沒有移植性 2.不利用調試和擴展 就依據我們大大小小項目&#xff0c;風風雨雨走過近20年&#xff0c;每個系統的業務邏輯處理幾乎都是用存儲過程實現的&#xff0c;沒發現多不…

p標簽文本段落中因編輯器換行引起的空格問題完美解決方案

目錄 1.修改前的代碼&#xff1a;2.修改后的代碼3.總結 在HTML文檔中&#xff0c;如何要在&#xff08;p標簽&#xff09;內寫一段很長的文本段落&#xff0c;并且沒有 換行。由于IDE或者編輯器界面大小有限或需要在vue中邏輯處理動態顯示文本&#xff0c;一行寫完太長&#x…

Eslint prettier airbnb規范 配置

1.安裝vscode的Eslint和prettier 插件 eslint&#xff1a;代碼質量檢查工具 https://eslint.nodejs.cn/docs/latest/use/getting-started prettier&#xff1a;代碼風格格式化工具 https://www.prettier.cn/docs/index.html /* eslint-config-airbnb-base airbnb 規范 esl…

高德地圖軌跡回放并提示具體信息

先上效果圖 到達某地點后顯示提示語&#xff1a;比如&#xff1a;12&#xff1a;56分駛入康莊大道、左轉駛入xx大道等 <!doctype html> <html> <head><meta charset"utf-8"><meta http-equiv"X-UA-Compatible" content"…

【前端CSS3】CSS顯示模式(黑馬程序員)

文章目錄 一、前言&#x1f680;&#x1f680;&#x1f680;二、CSS元素顯示模式&#xff1a;??????2.1 什么是元素顯示模式2.2 塊元素2.3 行內元素2.4 行塊元素2.5 元素顯示模式的轉換 三、總結&#x1f680;&#x1f680;&#x1f680; 一、前言&#x1f680;&#x1f…

巴圖自動化Modbus協議轉Profinet協議網關模塊連智能儀表與PLC通訊

一、現場要求:PLC作為控制器&#xff0c;儀表設備作為執行設備。執行設備可以實時響應PLC傳送的指令&#xff0c;并將數據反饋給PLC&#xff0c;從而實現PLC對儀表設備的控制和監控&#xff0c;實現對生產過程的精確控制。 二、解決方案:通過巴圖自動化Modbus協議轉Profinet協議…

前端面試題4(瀏覽器對http請求處理過程)

瀏覽器對http請求處理過程 當我們在瀏覽器中輸入URL并按下回車鍵時&#xff0c;瀏覽器會執行一系列步驟來處理HTTP請求并與服務器通信。下面是瀏覽器處理過程 1. 解析URL 瀏覽器首先解析輸入的URL&#xff0c;提取出協議&#xff08;通常是http://或https://&#xff09;、主…

Robust Test-Time Adaptation in Dynamic Scenarios--論文閱讀

論文筆記 資料 1.代碼地址 https://github.com/BIT-DA/RoTTA 2.論文地址 https://arxiv.org/abs/2303.13899 3.數據集地址 coming soon 1論文摘要的翻譯 測試時間自適應(TTA)旨在使預先7訓練的模型適用于僅具有未標記測試數據流的測試分布。大多數以前的TTA方法已經在…

為什么要卸載手機上面的抖音?

刪除抖音等社交媒體應用可能出于多種原因&#xff0c;這里列舉一些常見的考慮因素&#xff1a; 1. **時間管理**&#xff1a; 抖音和其他社交媒體平臺可能會占用大量時間&#xff0c;影響個人的日常生活和工作學習效率。 這個對于自己而言是一個客觀存在的事情&#xff1a; 2.…

安卓請求服務器[根據服務器的內容來更新spinner]

根據服務器的內容來更新spinner 本文內容請結合如下兩篇文章一起看: 騰訊云函數node.js返回自動帶反斜杠 騰訊云函數部署環境[使用函數URL] 現在有這樣一個需求,APP有一個下拉選擇框作為版本選擇,因為改個管腳就變成一個版本,客戶需求也很零散,所以后期會大量增加版本,這時候每…

數據預處理:統計關聯性分析/數據清洗/數據增強/特征工程實例

專欄介紹 1.專欄面向零基礎或基礎較差的機器學習入門的讀者朋友,旨在利用實際代碼案例和通俗化文字說明,使讀者朋友快速上手機器學習及其相關知識體系。 2.專欄內容上包括數據采集、數據讀寫、數據預處理、分類\回歸\聚類算法、可視化等技術。 3.需要強調的是,專欄僅介紹主…

gitLab使用流程

標題1.配置賬戶 git config --global user.name git config --global user.email mygitlabmali.cn 標題2.生成秘匙 ssh-keygen -t rsa -C “mygitlabmail.cn” 。 //輸入命令后一直回車 &#xff0c;輸入命令后一直回車&#xff08;密碼可以不填&#xff09;&#xff0c;至…

Java面試題系列 - 第2天

題目&#xff1a;Java中的線程池模型及其配置策略 背景說明&#xff1a;在Java多線程編程中&#xff0c;線程池是一種高效的線程復用機制&#xff0c;能夠有效管理和控制線程的創建與銷毀&#xff0c;避免頻繁創建和銷毀線程帶來的性能開銷。理解和掌握線程池的配置策略對于優…

Anaconda+Pycharm兩個軟件從頭到尾下載流程

前言&#xff1a; 1、使用教程前&#xff0c;請將電腦上的所有的Python卸載掉。再下載Anaconda&#xff0c;Anaconda這個軟件里面就含有python。 徹底刪除python方法&#xff1a; 1、計算機——屬性——高級系統設置——環境變量 2、查看電腦用戶自己設計的環境變量&#x…

【智能制造-8】輸送線運動控制算法

輸送線運動控制算法包含哪些內容&#xff1f; 輸送線運動控制算法包含以下幾個主要內容: 速度控制算法: 根據目標速度和當前實際速度,調整電機的輸出功率,達到所需的輸送線速度。 常見的算法包括PID控制、自適應控制等。位置/距離控制算法: 監控輸送線上物料的位置或移動距離…

Xilinx FPGA:vivado關于RAM的一些零碎的小知識

一、xilinx fpga嵌入式存儲單元 RAM----隨機存取存儲器&#xff1a;上電工作時可以隨時從任何一個指定的地址寫入&#xff08;存入&#xff09;或讀出&#xff08;取出&#xff09;信息。缺點是一旦斷電所存儲的數據將隨之丟失。RAM在計算機和數字系統中用來暫時性存儲程序、數…

golang net.url 標準庫

golang net.url 標準庫 Go 語言標準庫中的 net/url 包提供了用于 URL 解析、構建和查詢的功能。這個包使我們能夠處理 URL&#xff0c;從中提取出各個部分&#xff0c;比如協議、主機、路徑和查詢參數等。以下是 net/url 包中一些常用的功能&#xff1a; 解析URL&#xff1a;使…

下載安裝MySQL

1.軟件的下載 打開官網下載mysql-installer-community-8.0.37.0.msi 2.軟件的安裝 mysql下載完成后&#xff0c;找到下載文件&#xff0c;雙擊安裝 3.配置環境變量 4.自帶客戶端登錄與退出