醫學交互作用分析的目的和用途(R語言)
醫學交互作用分析一直是醫學數據分析的組成部分,總結最近的一些認識。
目的:
- 在獨立危險因素鑒定的研究中,(獨立危險因素的)交互作用可以作為獨立危險因素的屬性之一來進行分析;
- 在預測模型構建的研究中,交互作用分析用于決定模型方程中交互項的取舍,以實現更高效能的模型,只適用于線性模型,因為非線性的樹形模型不需要單獨處理交互項。
所以,交互作用分析不是單獨的數據分析類型,而是要與其他的分析過程進行整合,豐富分析內容,更全面說明問題。
步驟:
- 交互作用項的掃描,當方程中變量比較多的時候,逐個探索變量間交互作用是繁瑣的工作,有一些方法可以批量掃描變量間的交互作用,略略探索,SHAP分析中使用xgboost算法時可以展示交互作用,iml包中可以計算交互作用強度,還有一個vivid包可以通過熱圖和網絡圖來批量展示交互作用。具體怎么理解篩選出的交互作用,還有待于進一步學習。
下圖是iml包生成的交互作用強度圖,vivid是值得嘗試的一個包。
- 交互作用的逐個鑒定,當有了觀察對象之后,就可以使用傳統的交互作用分析方法來逐個鑒定變量間的交互作用,最終根據P值來確定是否是真正的交互作用并進行可視化。根據交互作用中兩個變量類型的不同,采用不同的R包和算法,如果交互作用雙方都是分類變量,可以使用Publish包進行亞組分析、epiR包和interactionR包,如果有一方是連續變量,可以使用interactions包。
下圖是interactions包生成的交互作用圖。
以上步驟鑒定出的作用,在不同的研究中,作為獨立危險因素的一個屬性來進行報道,整合到獨立危險因素鑒定的相關研究流程中,或者用于構建線性的預測模型,都可以起到豐富研究內容的目的。