
在介紹統計學中最重要的定理之一-中心極限定理-之前,我們先來想一個問題:統計學的目的是什么?根據<Mathematical statistics with application 7th Edition>書中所寫的:
統計學的目的是基于從總體中的樣本所獲得的信息,對總體進行推斷,并且提供推斷的準確性。
這其中有幾個關鍵詞:總體,樣本,推斷。總體的含義就是所研究對象的所有可能的數據,比如,全世界每個人的身高,工廠上個月生產出來的每個燈泡的壽命等等。樣本的概念是從總體中衍生出來的,比如,全世界任意20個人的身高,工廠上個月任意100個燈泡的壽命,樣本就是總體的一個子集。通常情況下總體的數據是難以獲得的,而樣本是容易得到的,所以統計學的目的就是從樣本數據來推斷總體。
接下來我們通過一個實際例子來介紹中心極限定理:
一個工廠所生產的燈泡的平均壽命是1000小時,方差是25個小時。我買了36個燈泡裝在家里,那么這個9個燈泡的平均壽命超過1005小時的概率是多少
求解問題的第一步是將實際問題抽象出數學模型。在實際應用中,數學模型的建立遠遠要比解題方法更重要。首先定義隨機變量:
由題中信息可得:
那么問題的求解轉化為求解
我們并不知道隨機變量
設定有個獨立且完全相同的隨機變量
,他們的期望
,方差
。定義隨機變量:
那么,當趨向于無窮大時,隨機變量
趨向于標準正態分布。
回到我們的問題,求解
其中
中心極限定理實際上是揭示了任意一個總體中樣本均值的分布規律。
通常在教科書中,在描述完中心極限定理后,會出現3個字:證明略。接下來本文使用隨機變量特征函數的方式來對其進行證明。
首先,引入隨機變量特征函數的概念。對于隨機變量
那么對于
而標準正態分布