目錄
檢驗無因果效應假說
硬幣投擲的特殊性何在?
檢驗無因果效應假說
無因果效應假說認為,有些人存活,有些人死亡,但接受mAb114治療而不是ZMapp與此無關。在174例接受mAb14治療的患者中,113/174=64.9%存活了28天,在169例接受ZMapp治療的病人中,有85/169=50.3%存活了28天。這是無因果效應假說為錯誤假說的確鑿證據嗎?這種差異可能是由偶然性——一系列運氣不好的硬幣投擲將人們分配給了mAb114或ZMapp——而不是由治療引起的效應嗎?
在PALM試驗中,我們看到了幾個我們知道是由硬幣正面或反面掉落的偶然性造成的差異。硬幣投擲顯示,ZMapp組中有87名女性和82名男性,其中87/(87+82)=51.5%的比例為女性。硬幣投擲將98名女性和76名男性納入mAb114組,因此該組女性的比例為98/(98+76)=56.3%。這種差異,4.8%=56.3%-51.5%,是由偶然性,即硬幣一次又一次下落的特殊方式造成的。存活率的差異,14.6%=64.9%一50.3%,是否也可能是由偶然性,而不是處理效應造成的呢?
顯然,存活率的差異確實可能是由偶然性所致,前提是我們接受任38何邏輯上可能的東西現實中也可能。當然,沒有人會這樣做;如果你那
樣想的話,你就連過馬路也做不到了。許多邏輯上可能的事情都是不可
思議的。
在343例患者中,有113+85=198?例存活者,或比例為198/343一57.7%。在343例患者和198例存活者的總體中,如果沒有處理效應,從邏輯上講,一系列硬市投擲可能會選擇174例患者和113例存活者施予mAb114,也可能選擇169例患者和85例存活者施予ZMapp。事實上,這種情況可能以多種方式發生。實際上,有1.51×109個不同的343個正面和反面序列正是這樣做的。盡管1.5×10乍一看似乎是一個令人印象深刻的大數字,但有7.4×101個348次硬幣投擲序列,可以選擇17%例患者施予mAb114。存活率的差異為14.6%=64.9%-50.3%,這可能是偶然造成的嗎?這個問題顯然比邏輯上的可能性更重要。
認為mAb114和ZMapp的效果沒有差異的假說到底是什么呢?簡單地說,我們經常談到無因果效應假說,但我們的意思是,處理和對照情況的效果并沒有什么不同。這一假說表明,343例患者中的每一例患者i,無論施予mAb114還是ZMapp,存活到28天的情況都是相同的。如同第一章所述,我們把mAb114寫為T,把ZMapp寫為C,無因果效應假說聲稱,對于每個i,都有rri=rc,i=1,2,…,343。這個假設通常被稱為“費歇爾無因果效應假說”,因為它在他的隨機實驗理論中發揮了重要作用。關于硬幣投擲,你必須相信些什么才能認同這個假說?如果這一假說是真的,14.6%=64.9%-50.3%的存活率差異會是一個常見的事件(比如在一枚公平硬幣的兩次投擲中得到兩個正面),還是一個相當罕見的事件(比如投擲硬幣七次得到七個正面)?
在一枚公平硬幣的兩次投擲中有兩個正面的概率是(1/2)2=1/4,但在一枚公平硬幣的七次投擲中有七個正面的概率是(1/2)'=0.0078。如果1000人投擲兩次公平的硬幣,我們預計250人會得到兩個正面。如果1000人投擲七次公平的硬幣,我們預計只有不到8人能得到七個正面。擲硬幣七次得到七個正面,是懷疑硬幣是否公平的理由,但擲硬幣兩次得到兩個正面并不是懷疑硬幣是否公平的理由。
PALM試驗中的存活率類似于兩次投擲中兩個正面還是七次投擲中七個正面?如果在所有343例患者中,mAb114和ZMapp之間沒有差異,那么14.6%的存活率差異是罕見還是常見事件呢?
在這一點上,有兩個細節需要注意。事實上,mAb114以14.6%的優勢擊敗了ZMapp。如果mAb114以大于14.6%的優勢擊敗?ZMapp,那么我們的印象會更深刻。因此,我們真正在考慮的是差異等于或大于14.6%的概率,而不是差異正好等于14.6%的概率。此外,在試驗之前,我們并不知道mAb114會是勝出者。如果ZMapp以14.6%的優勢獲勝,那么我們就將討論ZMapp至少以14.6%獲勝的可能性。我們來修正這兩個細節,修正后的問題是:如果mAb114和ZMapp的效果沒有差異,那么單是投擲硬幣在存活方面產生明顯差異的可能性有多大?是正的還是負的?與我們實際看到的差異一樣大還是更大?事實證明,答案是0.0083。在PALM試驗中,存活率的差異更接近于一枚硬幣投擲七次得到七個正面,其概率為(1/2)7=0.0078,而不是兩次投擲得到兩個正面,其概率為(1/2)9=0.25。在mAb114導致的死亡率沒有真正降低的情況下,要產生14.6%=64.9%一50.3%的存活差異,需要一個非常罕見的硬幣投擲序列。
0.0083的概率是從哪里來的?它來自公平投擲硬幣的表現。我們可以把任務交給計算機。無因果效應假說表明,343例患者中,無論給予mAb114還是ZMapp,都有113+85=198人存活,343-198=145人死亡,如果用一種藥物替代另一種藥物,沒有人的存活率會發生改41變。這個假說可能是真的,也可能是假的,但上述內容就是假說之所言。在這個假說的總體中,我們可以告訴計算機投擲一枚公平硬幣343次,通過投擲硬幣將患者分配到mAb114組或ZMapp組。這將產生某個mAb114-ZMapp的存活率差異。這種存活率差異是由偶然性所致,因為在假說的總體中,沒有人的存活取決于施予哪種藥物。我們可以讓計算機重復計算。如果計算機做了1000次這個任務,創建了1000個假的PALM試驗,我們預計1000個中大約有8個會產生與我們看到的相同或更大的存活率差異,1000個中大約有992個會產生更小的存活率差異。我們看到的存活率差異14.6%=64.9%-50.3%,可能是由于偶然——這是一種邏輯上的可能性——但這是一種非常不可能的可能性。
簡要概括一下,推理如下。我們的問題是,如果mAb114和ZMapp之間沒有差異,那么觀察到的14.6%=64.9%-50.3%的存活率差異是不是由一個患者被分配到mAb114,另一個患者被分配到ZMapp的不幸序列所致?我們發現這在邏輯上是可能的,但現實非常不可能:這樣一個硬幣投擲序列出現的概率是0.0083。為了維護42?mAb114和ZMapp對存活率的影響沒有區別的觀點,你一定要堅持說你是偶然觀察到一個非常不可能的硬幣投擲序列。
硬幣投擲的特殊性何在?
隨機實驗根據一枚公平硬幣新的投擲來分配處理或對照。在隨機實
驗中硬幣投擲的哪些性質是重要的?哪些屬性是次要的呢?
硬幣正面朝上的概率是二分之一這一點并不重要。我們可以擲骰子,當1或2出現時,將一個人分配到處理組,當3、4、5或6出現時,將一個人分配到對照組。在這種情況下,進入處理組的概率是三分之一,而進人對照組的概率是三分之二,但這仍然是一個完全隨機的實驗。這類實驗有時是在個體處理費用昂貴而對照條件不昂貴的情況下進行的。投擲硬幣和擲骰子有一個重要的共同點:它們產生的是一種公平的彩票。這種彩票中獎的概率并不重要。關鍵之處在于,每個人都有相同的中獎機會。用硬幣,中獎的概率是一半,但對每個人來說都是一半。前面所提到的那種擲骰子方式,中獎的概率是三分之一,但對每個人來說都是三分之一我們每個人都是獨一無二的。不可能將獨一無二的個人同時分配到處理組和對照組,從而使兩組完全相同。華盛頓是獨一無二的,如果他在一個組而不是另一個組,處理組和對照組就不可能完全相同。隨機化并不能讓不同的人變得相同;這是不可能的。由于是一種公平的彩票,隨機化使得接受處理或對照與否,與使人們有所不同的一切因素都無關。在一切發生之前,我們經常說,這是那種能上大學的人,這是那種會進監獄的人,或者這是一個能成為好父親的人。相比之下,在隨機實驗中,在實驗發生之前,我們永遠不能說,這是處理組的人的類型。因為這是一種公平的彩票,沒有哪種類型的人最終會進入處理組。你可以根據自己的喜好虛構出不同類型的人,但一個人的類型永遠無法預測他是否會受到處理,因為它永遠無法預測投擲硬幣的結果。
給喬治·華盛頓放血和體液說
18世紀的醫生會發現放血對病人有害嗎?我們來想想那個時代的醫生們。他們有硬幣。他們知道怎么投擲它們。他們可以衡量結果,區分死者和生者。他們甚至對概率有基本的了解。他們缺少的是什么呢?也許,正如之前提到的,他們缺少的是杜威所稱的那種實驗的思維習慣。
如果18世紀發現病人因放血而受到傷害,醫生們可能會對建立在體液理論基礎上的醫學知識結構提出質疑。隨機試驗中一項處理的成敗可能會刺激疾病生物學的基礎研究;這反過來可能會產生更好的治療方法,以便在進一步的試驗中進行評估
-就像今天一樣。
print('要天天開心啊')