- 實驗目的:
- 掌握正態分布和二項分布中,功效與樣本容量之間的關系;
- 學會利用R軟件完成一個正態總體方差和兩個正態總體方差比的區間估計和檢驗。
實驗內容:
(習題5.28)一種藥物可治療眼內高壓,目的是阻止青光眼的發展。現試驗了 10 名病人,治療一個月后,他們的眼壓平均降低了 5mmHg ,且標準差為 10mmHg。其功效為多少?如果功效在80% 以上,應當至少選擇多少名試驗者?
提示:此題是單個正態總體的功效和樣本容量的計算問題。參考例5.34。在使用power.t.test()函數時,參數delta=5,sd=10。
解:
(1)功效是多少?
功效大約為0.184
源代碼及運行結果:(復制到此處,不要截圖)
> power.t.test(10,delta = 5,sd = 10)
?????Two-sample t test power calculation
??????????????n = 10
??????????delta = 5
?????????????sd = 10
??????sig.level = 0.05
??????????power = 0.1838375
????alternative = two.sided
NOTE: n is number in *each* group
結論:此時功效為0.184,功效偏低
(2)功效在80% 以上,應當至少選擇多少名試驗者?
功效在80%以上,至少要選擇64名實驗者
源代碼及運行結果:(復制到此處,不要截圖)
> power.t.test(power = 0.80,delta = 5,sd = 10)
?????Two-sample t test power calculation
??????????????n = 63.76576
??????????delta = 5
?????????????sd = 10
??????sig.level = 0.05
??????????power = 0.8
????alternative = two.sided
NOTE: n is number in *each* group
結論:n=63.77.至少取64名實驗者
(習題5.29)為了檢測某種藥物服用后可能導致血壓升高,找了8名藥物服用者,他們的平均收縮壓為 132.86 mmHg ,樣本標準差為 15.34 mmHg。對照組共 21 人,他們的平均收縮壓為127.44 mmHg ,樣本標準差為 18.23 mmHg。 如果假設數據服從正態分布,試分析該藥物服用后是否能導致血壓升高?檢驗的功效是多少?如果功效要達到 80 每組至少取多少個樣本?
?????t test power calculation ?????????????n1 = 31.2884 ?????????????n2 = 21 ??????????????d = 0.8058214 ??????sig.level = 0.05 ??????????power = 0.8 ????alternative = two.sided |
提示:此題是兩個正態總體的功效和樣本容量的計算問題。參考例5.35。但此題與例5.35略有不同:此題的兩個樣本標準差不相同,因此在使用power.t.test()函數時,參數sd需要按P127公式(5.46)中的分母來計算。另外,也可以使用pwr包來計算功效。
解:
(1)功效是多少?
功效大約為0.464
源代碼及運行結果:(復制到此處,不要截圖)
> library(pwr)> n1<-8> n2<-21> mean_diff<- 132.86-127.44> sd1<-15.34> sd2<-18.23> pwr.t2n.test(n1 = n1,n2 = n2,d = mean_diff/sqrt((sd1^2/n1)+(sd2^2/n2)))
?????t test power calculation
?????????????n1 = 8
?????????????n2 = 21
??????????????d = 0.8058214
??????sig.level = 0.05
??????????power = 0.4643853
????alternative = two.sided
結論:此時功效為0.464,功效偏低
(2)功效在80% 以上,應當至少選擇多少名試驗者?
功效在80%以上,至少要選擇32名實驗者
源代碼及運行結果:(復制到此處,不要截圖)
結論:n=31.3,至少要選擇32名實驗者
(習題5.30)對于習題 5.26 ,如果要求功效達到 80% 以上,試驗時至少選擇多少個樣本?
提示:此題是兩個總體比例的功效和樣本容量的計算問題。參考例5.36。
解:
源代碼及運行結果:(復制到此處,不要截圖)
?power.prop.test(power = 0.8,p1 = 34/70, p2 = 31/80)
?????Two-sample comparison of proportions power calculation
??????????????n = 399.1236
?????????????p1 = 0.4857143
?????????????p2 = 0.3875
??????sig.level = 0.05
??????????power = 0.8
????alternative = two.sided
NOTE: n is number in *each* group
結論:n=399.12,至少要選擇400個樣本,才能讓功效達到80%
(習題5.31)某汽車公司要求員工恪守時間,以在公眾面前樹立良好的值得信賴的形象。公司要求各個汽車的汽車到站時間的變化不能太大,具體要求是:到站時間的標準差不能超過2分鐘。公司在某市的汽車中轉站隨機地抽取了 10 次汽車的到站時間如下(單位:分鐘):
15 .2 ?17.5 ?19.6 ?16.6 ?21 . 3??17.1??15.0 ?15.5 ?20.0??16.2
試分析該公司的汽車司機是否遵守時間規定?
> source("C:\\Users\\黃培滇\\Desktop\\R語言生物統計學\\chap05\\var1.test.R")> X<-c(15.2,17.5,19.6,16.6,21.3,17.1,15.0,15.5,20.0,16.2)> var1.test(X,var = 2^2,alternative = "less")
$X.squared [1] 10.8 $sample.var [1] 4.8 $df [1] 9 $conf.inter [1] ?0.00000 12.99204 $p.value [1] 0.7103325 |
提示:此題是單個正態總體的方差檢驗。參考例5.37。
解:提出假設:
H0:σ2≥22
H1:σ2<22
源代碼及運行結果:(復制到此處,不要截圖)
結論:P值>0.05,接受原假設,即到站時間的標準差超過2分鐘
(習題5.32)對習題5.16中甲乙兩種稻種的數據作方差比的區間估計,并用其估計值來判定兩數據是否等方差。若兩數據方差不相等,試重新計算兩稻種產量的期望差m1-m2的置信區間(a?=0.05)。
提示:在R軟件中,var.test()函數能夠提供兩個樣本方差比的區間估計。此結果可認為方差不等。因此重新計算期望差時應該采取方差不等的參數。
解:
源代碼及運行結果:(復制到此處,不要截圖)
> a<-c(140,137,136,140,145,148,140,135,144,141)> b<-c(135,118,115,140,128,131,130,115,131,125)> Table<-data.frame(a,b)> var.test(a,b)
F test to compare two variances
data: ?a and b
F = 0.23533, num df = 9, denom df = 9, p-value =
0.04229
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
?0.05845276 0.94743902
sample estimates:
ratio of variances
?????????0.2353305
> t.test(a,b,var.equal = F)
Welch Two Sample t-test
data: ?a and b
t = 4.6287, df = 13.014, p-value = 0.0004712
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
??7.359713 20.240287
sample estimates:
mean of x mean of y
結論:var.test()計算結果中,P值<0.05,且置信區間不包含1,這說明兩者方差并不相等,且重新求出其95%置信區間為7.40,,20.24
(習題5.33)檢驗習題5.24中試驗組和對照組的數據的方差是否相同。
提示:此題是兩個正態總體的方差檢驗。參考例5.38。
解:提出假設:
H0:σ12=σ22
H1:σ12≠σ22
源代碼及運行結果:(復制到此處,不要截圖)
> 甲<-c(140,137,136,140,145,148,140,135,144,141)> 乙<-c(135,118,115,140,128,131,130,115,131,125)> Table<-data.frame(甲,乙)> with(Table,var.test(甲,乙))
F test to compare two variances
data: ?甲 and 乙
F = 0.23533, num df = 9, denom df = 9, p-value =
0.04229
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
?0.05845276 0.94743902
sample estimates:
ratio of variances
?????????0.2353305
結論:P值<0.05,拒絕原假設,即試驗組和對照組的數據的方差存在差異
思考:
檢驗功效 p?就是正確地否定了錯誤的原假設的概率,即 p?= 1-β,其中 β?稱為犯第???二??類錯誤的概率。在R軟件,利用????power.t.test()??????????函數可以完成正態分布均值(差)的檢驗功效或樣本容量的計算;利用????pwr.prop.test()???????????函數可以完成兩組數據比率差的檢驗功效或樣本容量的計算。
影響均值檢驗功效的因素有:
樣本量n:其他條件不變情況下,樣本量越大,發生第二類錯誤的概率 β (包括第一類錯誤的概率)越小,因此功效越__高___;
差異Δ(兩總體時是μ1-μ2,單總體時是μ1-μ0):以單個總體為例,其他條件不變情況下,差異越大,說明樣本與總體之間的差異越大,越容易被檢驗出來,因此統計功效越__高__。
樣本標準差σ:σ越小,功效越大。
顯著性水平α:由于α與 β 是此消彼漲的關系,因此α越大,β 越小,因此功效越__高___;
事實上,上述前3個因素①②③與功效共4個量,知道其中3個,就可以求出另一個。這也是power.t.test()函數中最重要的幾個參數。
單個正態總體的方差的區間估計和檢驗(設樣本容量為n)
當這個總體的均值μ已知時,用到的是哪個分布?
正態分布
當這個總體的均值μ未知時,用到的是哪個分布?
t分布
兩個正態總體的方差比的區間估計和檢驗(設兩個樣本容量分別為n1、n2)
當這兩個總體的均值μ1、μ2已知時,用到的是哪個分布?
F分布
當這兩個總體的均值μ1、μ2未知時,用到的是哪個分布?
F分布
在R的基本函數中,沒有計算單個總體方差的區間估計與假設檢驗的函數;兩個正態總體的情況下,可通過方差比的估計和檢驗來兩個總體的方差是否相同,可以利用R軟件中的????var.test()??????????函數來完成。