1.什么是秩和檢驗?
秩和檢驗,也稱為Wilcoxon 秩和檢驗,是一種非參數統計檢驗方法,用于比較兩個獨立樣本的中位數是否有顯著差異。它不要求數據滿足正態分布假設,因此適用于小樣本或者數據不滿足正態分布假設的情況。
在進行秩和檢驗時,首先對兩個樣本的數據進行合并,然后對合并后的數據進行排序,并為每個值分配一個秩(從小到大)。接下來,計算兩組樣本的秩和,然后利用秩和來比較兩組樣本的位置關系。
秩和檢驗的原假設是兩個獨立樣本的中位數相同,備擇假設是兩個獨立樣本的中位數不同。通過計算秩和的大小以及相應的P 值來判斷是否拒絕原假設,從而得出結論是否存在顯著差異。
還是燈泡工廠的故事,老板想知道新燈泡和舊燈泡使用壽命有沒有差別,以下是兩組燈泡的使用壽命,但是有一只新燈泡超過了800小時,卻還是一直亮著。老板沒有耐心等下去了,只記錄了那只燈泡的使用時間大于800小時。那么我們該如何分析呢?這種情況下,我們采用秩和檢驗的方法。
首先,我們將兩組數據合并,并對所有數據進行排序,然后給每個值分配秩。接下來,我們計算每個組的秩和,最后使用秩和檢驗的公式計算統計量和P值。
合并數據并進行排序:
對合并后的數據進行排序得到:
642, 646, 648, 649, 650, 650, 651, 652, 654, 658, 684, 685, 691, 705, 709, 716, 718, 719, 728, 800
接下來,給每個值分配秩(按照從小到大的順序,如果有重復值,則取平均秩):
642: 1, 646: 2, 648: 3, 649: 4, 650: 5.5, 650: 5.5, 651: 7, 652: 8, 654: 9, 658: 10, 684: 11, 685: 12, 691: 13, 705: 14, 709: 15, 716: 16, 718: 17, 719: 18, 728: 19, 800: 20
接下來,計算每個組的秩和:
第一組的秩和:11 + 12 + 13 +14 + 15 + 16 + 17 + 18 +19 + 20 = 155
第二組的秩和:1 + 2 + 3 + 4 + 5.5 + 5.5 + 7 + 8 + 9 + 10 = 55
然后,我們可以使用秩和檢驗的公式計算統計量和P值。
第一組的秩和為155, 第二組的秩和為55。
如果兩組數據屬于同一分布,那么他們的秩和應該差不多,當n1足夠大時,秩和近似服從均數為n1(N+1)/2, 方差為n1n2(N+1)/12的正態分布,
計算得到W和P值分別是:
P值小于0.05,因此,我們拒絕零假設,即兩組數據之間存在顯著差異。
也可以用代碼算: