孟德爾隨機化(MR)入門介紹和分章分享(暫時不解讀)
大家好,孟德爾隨機化大火,但是什么是孟德爾隨機化,具體怎么實操呢
這沒有其他教程的繁冗,我這篇講最基礎的孟德爾隨機化的核心步驟,這個理解之后,再去考慮混雜因素等等術語。
孟德爾隨機化(MR),其實是研究兩個變量之間的因果關系。也就是研究誰決定了誰,是因果關系,而不是相關關系。
我畫了一張圖,協助理解:
現在再來讀這句話是不是就理解MR了:孟德爾隨機化(Mendelian Randomization, MR)是流行病學研究中評估病因推斷的數據分析技巧,它是利用與暴露因素具有強相關的遺傳變異作為工具變量,來評估暴露因素與結局之間的因果關系。
?現在對三大假設是不是理解更深些了:
孟德爾隨機化三大假設:
①關聯性假設: SNP與暴露因素之間是強相關的。
②獨立性假設: SNP與混雜因素之間是獨立的。(本文暫沒提到這一點)
③排他性假設: SNP只能通過暴露因素對結局產生作用。
現在再來詳細介紹MR,會不會好理解些:
1?MR?背景與目的
1.1目的是明確因果關系
在關聯分析中我們時常面對的一個問題便是 我們很難確定一個變量是否是真正的因果變量,而非有其他未觀測的因素同時影響這個變量與結果,造成這個變量與結果相關聯。在循證醫學中,或是制定干預策略時,明確因果性是十分必要的。
這個問題實際上與內生性 endogeneity 相關,包括:反向因果關系 reverse causation, 忽略的混淆變量造成的偏倚 omitted variable bias due to confounding, 測量誤差measurement error, 以及雙向因果關系bidirectional causality等等問題。(這里的內生性在統計學上是指在回歸分析中,解釋變量(x)與誤差項相關。)
1.2. RCT是金標準,但缺點明顯
一般來說,明確因果關系的金標準時隨機對照試驗 RCT randomized control trial (RCT), 即對受試者隨機分為對照組和實驗組,以研究某個因素的影響。但現實中,要完成隨機對照試驗的難度非常高,需要大量的人力物力,有時因為倫理問題,對某個因素的研究幾乎是不可能的。這時我們就要借助其他方法,而孟德爾隨機化就是其中之一。
1.3. 孟德爾隨機化與RCT的相似性
孟德爾隨機化(MR,Mendelian randomization)便是為了解決以上問題而開發的方法,MR與RCT直接相關,兩者有很高的相似性,如下圖所示。
孟德爾隨機化的核心其實是利用了孟德爾第二定律,也就是自由組合規律(law of independent assortment),當具有兩對(或更多對)相對性狀的親本進行雜交,在子一代產生配子時,在等位基因分離的同時,非同源染色體上的基因表現為自由組合,這一過程類似于隨機對照試驗中的隨機分組,所以我個人理解的孟德爾隨機化就是 基于孟德爾第二定律的隨機對照試驗。
為什么MR可以探究因果關系呢,大家可以看下這篇文章的介紹部分,有助于理解MR
?歡迎評論