f分布表完整圖_【教育統計答疑】如何理解正態分布、均值分布、^2分布、t分布和F分布...

許多教育統計的初學者都表示這幾個分布感到學起來非常吃力,結合最近上課的體會以及答疑的情況,覺得很有必要在這里簡單地對這部分內容進行澄清和梳理,以助理解。

首先,“為什么要學習這幾個分布”可能是許多人糾結的問題,明明已經在電腦中裝了SPSS軟件了,那么復雜而繁瑣的公式不應該直接內置在軟件之中就可以了嗎?為什么還要花費功夫去學習它們呢?我只能說,在你對這部分內容不甚了解的情況下,你很難意識到其重要性。這些分布都各有所長,也就因為自然界和社會系統中這些分布存在的廣泛性,使得教育統計領域許多習以為常的假設背后都有充分的根據,例如為什么心理能力測量數據的相關性可以選用皮爾遜(Pearson)系數、為什么樣本的數量要在30個以上、為什么只有達到“顯著性水平”,才能說不同的變量之間存在統計意義上的差異等……諸如這樣的例子背后,都與數據的這些分布特征有關,正是由于知道如果從某個總體中抽取一定的數據作為樣本,這些數據將會存在著一定的分布規律,我們才能大膽地根據樣本數據對總體的情況進行大膽而有把握的判斷和推理……因此,簡而言之,當你能理解這些分布的時候,至少讓你在根據數據結果做出推斷的時候,對自己所得出的結論堅信不疑。

好了,解答完學習必要性的疑惑后,終于要進入正題了。

1.正態分布(Normal Distribution)

第一個我們要討論的概念就是正態分布,正態分布是所有概率分布中最重要的形式,如果沒有它,也就沒有接下來的那幾個分布。正態分布的特征表明被測事物處于穩定的狀態下,測量數據的波動是由于偶然因素引起的,所以在實踐中有廣泛的應用。在穩定的系統環境(如自然、人類社會等),許多事物和現象都會服從正態分布,例如人的身高、體重和智商;各種商品的尺寸和質量;自然環境的溫度、濕度和降雨量;考試的成績等。正態分布的重要性還體現在用樣本數據來推斷總體時,當樣本的數量足夠大的時,可以利用樣本的某些特征數據服從正態分布,進行推斷,獲得準確的結果。

正態分布一般記作? x~N(μ, σ^2),它的分布函數表達式為?ee0c49eb37dd73f8cdfa814269c3d1e1.png

其中,π是圓周率;e是自然對數的底;x為隨機變量的取值;μ為正態分布的均值(期望),σ^2是正態分布的方差。

正態分布的函數圖像是一條“中間高,兩端低,左右對稱的曲線”(如下圖所示)。

dfc0cf4b0d300d82a94cc614f995e5d8.png

特別的,當μ=0,σ^2=1時,我們稱X服從標準正態分布:X~N(0,1).

由于其分布函數比較復雜,函數圖像將隨著不同的和方差發生著變化,人們將一般的正態分布進行標準化,即對于一般的正態分布x~N(μ, σ^2),只要令Z=(x-μ)/σ,則轉化為標準正態分布 Z~N(0,1).為了便于計算,人們制作出相應的數值表,方便對不同的數據代入值進行查詢,這就是標準正態分布表(如下表)。

294b7e2c486215a31d07eca8a2a72dee.png

正態分布表是我們學習教育統計到目前為止接觸到的第一個表,它比較特殊,每一個Z值都會對應一個Y值和P值,其中P值是我們比較關心的,也就是概率大小,如圖所示,當Z_0=1.00的時候,直線Z=0,直線Z=1,正態曲線以及Z軸所圍成的面積(也就是陰影部分)的概率大小為0.34134,寫成數學表達式則為P{Z≤1.00}=0.34134。由于正態曲線是對稱的,因此正態分布表所能查到的數據只有非負數,至于Z負半軸部分則很容易根據正半軸的情況進行推算。

利用正態分布以及標準正態分布表還有許多其他的實際應用,如將原始分轉化為標準分數;根據錄取率計算錄取的上線分數等。關于正態分布的內容就先介紹這么多,如有興趣的可以參考相關書籍深入了解。(張敏強.《教育與心理統計學》[M].北京:人民教育出版社,2010,11:88-100)

正態分布部分性質的證明:

1bbcf88021fa0c44b1b09b156d73a77e.png

dba46268435e03bd6a3a5565370db8b4.png

72e6b1e7674d41042a614ff1f7df1493.png

如有興趣了解更多,還可訪問https://www.investopedia.com/terms/n/normaldistribution.asp

2. 均值分布(Meandistribution)(μ分布,? μ-distribution)

現在開始討論第二個分布,第一個分布是正態分布,正態分布是自然環境或者人類社會中普遍存在的數據分布特征,那么均值分布又是怎么來的呢?顧名思義,只要你從總體中隨機抽取若干組(如m)相同容量(如n)的數據,然后將每一組都求平均值,那么這m個平均值的分布情況就形成了均值分布(它的標準化形式稱為μ分布),而這樣的均值分布在一般情況下和正態分布的特征基本一致,因此均值分布也是正態分布,只是它的形狀一般會比總體更往對稱軸靠攏了而已。

那么,如果用數學語言來描述它的定義,即為設X服從正態分布,其均值為μ,方差為σ^2,則X~N(μ ,σ^2 ?),設x_1,x_2,…,x_n是總體X抽取的隨機樣本,則X?=1/n ∑_(i=1)^n?x_i 樣本的平均數。由于從總體中可以抽出多組的容量為n的樣本,則存在多個X?,此時X ?也服從正態分布,平均數為μ,方差為σ^2/n, 記作X?~(μ,σ^2/n)

為方便查表,作變換,

757e7696b1e0137a80d830ce34e1dc77.png

則Z~N(0,1)標準正態分布,又稱為Z分布,或u~N(0,1) , u分布。

對于均值分布,我們需要熟悉的是這個分布的均值μ和方差σ^2/n,標準差σ?√n,以及將一般均值分布轉化為標準正態分布的方法:Z=u=(X?-μ)/(σ?√n),然后能根據正態分布表查值即可。

由于均值分布通常會用來進行假設檢驗,我們會接觸到另外一個概念,顯著性水平α,那么α和標準正態曲線(Z表)有什么聯系呢?請看下圖(雙側檢驗為例),由于對稱和雙側檢驗,所以每邊的尾端陰影部分概率大小均為它的一半 α/2,它與標準正態分布表中的對應關系為α/2=0.5-P,也即P=0.5-α/2,我們可以很容易地根據正態分布表的近似P值查到相應的Z值和Y值。

7ed5ec5d614cecce3d2b22ea941340e3.png

? ? ? U分布的簡單應用:

32dea182352a5d9c0065210a00568823.png

如有興趣了解更多,還可訪問https://sciencing.com/calculate-distribution-mean-6715845.html

3.? 卡方(χ^2)分布(Chi-Square distribution)

卡方分布又是怎么來的呢?χ^2的符號就是“卡方分布”的縮寫記號而已,相當于一般函數的記號f(x)一樣,不能把它當作x^2!之所以卡方分布的符號記成平方的形式,是由于卡方分布的由來與平方有關,試看它的定義:

設X~N(0,1), x_1, x_2,…,x_n是總體X抽取的隨機樣本,則〖x_1〗^2+〖x_2〗^2+?+〖x_n〗^2是服從以n為自由度的χ^2分布,記作χ^2 ?~〖χ^2〗_((n)),自由度df=n.(自由度(degreeof freedom,df)就是所有類別中可以自由改變的類別數,在卡方分布中這n個樣本數據都是可以自由更換的,只要它們是來自N(0,1)總體就可以了。)

由此可知,卡方分布就是n項標準正態分布中抽出來的樣本數據的平方和的分布特征,它的密度函數為:

59bf1083f9e4d9fc1013fbdb73f47a00.png

函數圖像如下圖所示

3a8053cfe24219eddb644049966ff7b4.png

其中橫坐標表示卡方函數的取值x,,縱坐標表示x所對應的p(x)概率大小,概率密度圖像與橫坐標圍成的面積之和為1。卡方分布是一個正偏態分布(一般看函數圖像均值偏向小的一邊為正,偏向大的一邊為負)。隨著每次抽取的隨機變量X的個數不同,其分布的形狀會發生變化,n越小,分布偏斜;n越大,則會越接近于正態分布;當自由度n趨向無窮時,卡方分布即為正態分布。到此可見,無論是均值分布還是卡方分布,其圖像都與正態分布存在著千絲萬縷的聯系。

由于卡方分布密度函數計算比較復雜,因而人們編制了χ^2分布表,表中列出了χ^2變量在不同自由度下的臨界值63c11b6baf46c1d7f68c4d8dab2155e4.png(單側) [如果是雙側檢驗,為了便于記憶,則記一邊為aa38b96c9f2ed7170b8ce7e0ab7f1106.png,另一邊為d297c9b9d689662ebc1ea89e4981cce5.png,因為它的函數圖像并不對稱,因此不能將兩邊陰影部分的面積都當成是α/2]。

fd87fdc6e1d964b5e59c197ff50645a4.png

卡方分布多用于卡方檢驗,這部分內容將在后面學習非參數假設檢驗的時候進行深入介紹,目前需要掌握的就是能看懂卡方分布表,以及了解卡方統計量如何構造:如果樣本數據來自(標準)正態分布,則計算這些數據平方和的方法就可以視為一個卡方統計量。

例如,當對總體方差進行估計區間估計時。

6df7ded601b27f8da6e9a99d0fedb3c2.png

如有興趣了解更多,還可訪問

https://www.statisticshowto.datasciencecentral.com/probability-and-statistics/chi-square/

4. t分布(t-distribution)

從卡方分布開始,我們就是通過構造統計量,從而得到相應的分布規律;同樣的,t分布的產生也是如此。結合參數估計的實際應用,對于t分布的由來,我更想將其與參數估計聯系在一起。

由前面的u分布可知,當總體方差σ^2未知時,要對總體的均值u進行估計,就需要利用u分布的基本性質,利用標準正態分布的轉化方法構造出統計量 Z=(X ?-μ)/(σ?√n),從而可以得到對總體均值進行區間估計的方法。

而如果總體方差σ^2未知,同樣要對總體的均值μ進行估計,那么又應該如何解決這個問題呢?我們看到,(X ?-μ)/(σ?√n)表達式中的σ此時也變成了未知,則沒辦法直接繼續使用上一種情況的方法構造出統計量,但是我們又知道,樣本的方差的調整值 S_(n-1)^2可以看成總體方差的一個無偏估計,那么就可以用這個無偏估計值來取代上一種情況統計量中的σ,即(X ?-μ)/(S?√n),這樣一來,我們就引出了t分布統計量的基本形式:

236d8acb29f23e72c6efef840decdeaf.png

be7df2c0ffc5915e8fc177c8800ec0aa.png

db4caf99d7a916bf69fa72ad8fdb2194.png

T分布在后面的假設檢驗中將扮演關鍵的作用,如相關樣本的 t檢驗、獨立樣本 t檢驗中都是對 t分布的實際應用。

如有興趣了解更多,還可訪問

https://www.statisticshowto.datasciencecentral.com/probability-and-statistics/t-test/

5. F分布( F-distribution)

?對于F分布,目前只要知道它的基本定義以及會查 F分布表就可以了。

333d794be963a53ff543792ac7b9a233.png

如有興趣了解更多,還可訪問

https://www.thoughtco.com/f-distribution-3126583

由于編輯時間倉促,疏漏之處在所難免,如發現問題,歡迎批評指正!

參考文獻:

張敏強. 教育與心理統計學[M].北京:人民教育出版社,2010,11: 105-133.

劉新平 等. 教育統計與測評導論[M].北京:科學出版社,2013,11: 43-60.

[美]亞瑟?阿倫 等著,方雙虎 等譯. 心理統計學(第5版)[M].北京:中國人民大學出版社,2017,10:98-124.

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/532230.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/532230.shtml
英文地址,請注明出處:http://en.pswp.cn/news/532230.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

c語言第一章考試題及答案,C語言考試題庫及答案整理版.doc

C語言考試題庫及答案整理版.docC語言理論上機考試選擇題部分(共200題)1、下面程序的輸出是___D______#includevoid main(){ int k11;printf("k%d,k%o,k%x\n",k,k,k);}A) k11,k12,k11 B) k11,k13,k13C) k11,k013,k0xb D) k11,k13,kb2、在下列選項中,不正確的賦值語句是…

python每天定時9點執行_python每天定時運行某程序代碼

思路:利用time函數返回的時間字符串與指定時間字符串做比較,相等的時候執行對應的操作。不知道大家的思路是什么,感覺這樣比較耗CPU。。。。 此處設置為15:30:10 輸出相應內容,需要執行什么,就修改什么。 import time …

新穎的c語言題目,新穎版c語言經典習題100例(全面面)

新穎版c語言經典習題100例(全面面) (66頁)本資源提供全文預覽,點擊全文預覽即可全文預覽,如果喜歡文檔就下載吧,查找使用更方便哦!19.90 積分實用文檔C語言習題100例(最新整理版)習題目錄:(按住Ctrl點擊可以快速跳轉到…

c語言jt808協議庫,平臺如何應答——關于JT/T808協議

前兩篇也說明了一些應答的相關內容,對于剛接觸的開發者來說恐怕還是不太容易理解,這里專門列舉一個篇幅來講解如何針對終端設備上報的信息進行應答。嚴格來講,如果不應答,終端設備會判別為服務平臺斷開連接,就會重復發…

熊貓的python小課賬號_學習python中的pandas有沒有好的教程推薦?

之前好多人私信我python數據分析怎么快速入門,我在這里直接介紹一下自己的心得經驗吧。 要學習pandas,我并不建議看大量的教程,等看完教程,天都黑了,一覺醒來熱情都涼了。 我的建議是,首先放平心態&#xf…

rssi定位算法 c語言,【論文※】An RSSI Gradient-based AP Localization Algorithm 基于RSSI梯度的AP定位算法...

摘要:Recent rapid rise of indoor location based services for smartphones has further increased the importance of precise localization of Wi-Fi Access Point(AP).However,most existing AP localization algorithms either exhibit high errors or need s…

arm體系結構與編程_教程:如何學習嵌入式系統(基于ARM平臺)

一、嵌入式系統的概念 著重理解“嵌入”的概念 主要從三個方面上來理解。 1、從硬件上,將基于CPU的處圍器件,整合到CPU芯片內部,比如早期基于X86體系結構下的計算機,CPU只是有運算器和累加器的功能,一切芯片要造外部…

ubuntu nfs linux,Ubuntu的NFS功能配置

環境:Ubuntu 10.04步驟:1.sudo apt-get install portmap2.sudo apt-get install nfs-kernel-server注意:第2步我安裝失敗,換源后仍然如此,最后我在新立得里面搜索到nfs-kernel-server,安裝成功3.在更目錄下新建共享目錄:mkdir /forlinux4.gedit /etc/exprots,在后面添加/forlin…

python import 路徑_python import 上級目錄的導入

python import 上級目錄的導入,路徑,上級,文件,目錄,遞歸 python import 上級目錄的導入 易采站長站,站長之家為您整理了python import 上級目錄的導入的相關內容。 有時候我們可能需要import另一個路徑下的python文件,例如下面這個目錄結構,…

一個android工程生成兩個aar,android studio生成aar包并在其他工程引用aar包(示例代碼)...

1.aar包是android studio下打包android工程中src、res、lib后生成的aar文件,aar包導入其他android studio 工程后,其他工程可以方便引用源碼和資源文件2.生成aar包步驟:①.用android studio打開一個工程,然后新建一個Module&#…

python設計一個動物類_我用Python實現了12500張貓狗圖像的精準分類

我用 Python 實現了 12500 張貓狗圖像的精準分類 在這篇文章中,我們將展示如何建立一個深度神經網 絡,能做到以 90% 的精度來對圖像進行分類,而在深度神 經網絡,特別是卷積神經網絡興起之前,這還是一個非常困 難的問題…

android 尺寸變化動畫,Android ScaleAnimation類:尺寸變化動畫類

ScaleAnimation類是Android系統中的尺寸變化動畫類,用于控制View對象的尺寸變化,該類繼承于Animation類。 ScaleAnimation類中的很多方法都與Animation類一致,該類中最常用的方法便是ScaleAnimation構造方法。【基本語法】public ScaleAnimat…

javascript 本地對象和內置對象_詳解 JavaScript 面向對象

1. 概述JavaScript面向對象比較難理解的點是類的繼承。不管是es5寫法還是es6寫法,JavaScript繼承的本質是原型鏈。具體可看我的上一篇文章:田浩:詳解原型、原型鏈、構造函、實例、new?zhuanlan.zhihu.com因為es6有專門的語法,寫法…

android wifi設備連接通信,通過wifi與設備進行通信(Android)

通過wifi與設備進行通信(Android)[復制鏈接]本帖最后由 灞波兒奔 于 2019-2-17 21:40 編輯通過wifi與設備進行通信(Android)最近leader決定把app與設備之間的通信改為wifi,通過http協議實現設備之間的通信。相對與之前的藍牙通信,的確簡單不少&#xff0…

工作匯報ppt案例_【贈書】開工大吉!今年一定要干過寫PPT的!

不知不覺,春節就過去了,新年開工,朋友圈里曬滿了開工紅包,領了開工禮就意味著真正新的一年開始了。雖然假期的慵懶安逸留下了倦怠的后遺癥,但狀態依舊切換到工作模式,畢竟每年都希望能比過去更進一步&#…

android webview 長按復制,Android webview 點擊或長按有蒙層 – 熱愛改變生活

Android 使用 webview 加載本地 html,在本地 html 上面點擊的時候會有一層橙色的蒙層,使用下面的代碼可以去掉。body, div, dl, dt, dd, ul, ol, li, h1, h2, h3, h4, h5, h6, pre, code, form, fieldset, legend, input, button, textarea, p, blockquo…

postscript打印機什么意思_漲知識|你不知道的關于打印機的打印過程和打印機驅動的那些事...

以前一直以為打印很簡單,不就是編輯好文件按個“打印”就行了?但其實打印過程可以復雜到你分分鐘“懷疑人生”。你以為的打印過程可能是這樣的 ↓。我們看到的打印過程然而,真正的打印過程是這樣的 ↓。實際上的打印過程打印機打印一頁文件或…

python dicom圖像分割_python讀取DICOM頭文件的實例

這篇文章主要介紹了關于python 讀取DICOM頭文件的實例,有著一定的參考價值,現在分享給大家,有需要的朋友可以參考一下 用dicompyler軟件打開dicom圖像,頭文件如圖所示:當然也可以直接讀取: ds dicom.read_…

索尼android電視圖片輪播,電視投屏居然還能這樣玩?

原標題:電視投屏居然還能這樣玩?現如今,投屏幾乎成為大家日常生活必不可少的一種觀影方式,通過電視投屏可以帶來更清晰的畫面效果,成為追劇黨以及各類球賽愛好者的不二之選。那么今天小智就以索尼電視為例,…

python源碼多平臺編譯_提升Python程序運行效率的6個方法

Python是一個很酷的語言,因為你可以在很短的時間內利用很少的代碼做很多事情。不僅如此,它還能輕松地支持多任務,比如多進程等。Python批評者有時會說Python執行緩慢。本文將嘗試介紹6個技巧,可加速你的Python應用程序。 1.讓關鍵…