文章目錄
- 目錄:
- 1、知道期望/方差/偏度/峰度,獨立和不相關等概念是什么。
- 2、契比雪夫不等式
- 3、大數定理/中心極限定理
- 4、伯努利定理
- 5、矩估計
- 6、最大似然估計
- 7、協方差和相關系數
目錄:
1、知道期望/方差/偏度/峰度,獨立和不相關等概念是什么。
期望(均值):離散型和連續型。(求面積)
方差:表示數據的離散程度。對應的表達式:E(x2)-E2(x)
偏度的數學含義:衡量隨機變量概率分布的不對稱性。
峰度的數學含義:是概率密度在均值處峰值高低的特征。
了解如何判斷兩個事件獨立,由于A與B相互獨立所以P(A|B)=P(A)。
獨立與不相關的關系(獨立是不相關的充分不必要條件)
2、契比雪夫不等式
知道切比雪夫不等式數學含義:隨機變量X服從正態分布,則X的取值基本上集中在期望μ附近。
3、大數定理/中心極限定理
知道大數定律的意義:當數據足夠多,數據的平均值也就趨近于期望μ。
中心極限定理:隨機變量Xi互相獨立,服從同一分布且具有相同的期望μ和方差σ2則隨機變量收斂到正態分布。
中心極限定理的意義:現實生活中的很多隨機現象可以看做是許多因素獨立影響的綜合反映,往往近似服從正態分布。
4、伯努利定理
伯努利定理:是大數定理的初級版本,有特殊的意義即用頻率來估計概率提供了一個理論依據。
5、矩估計
矩估計:矩估計可以求得期望和方差的值:相當于管中窺豹,以部分數據推導出對應的均值和方差。
矩:描述變量的分布形狀。
一階原點矩指的是隨機變量的平均值,即期望值。
二階中心矩指的是隨機變量的方差。
三階矩指的是隨機變量的偏度。
四階矩指的是隨機變量的峰度。
6、最大似然估計
似然概率:即獨立事件X1、X2…同時發生的概率;
θ代表的是參數,X代表的是樣本。
最大似然估計:即確定什么樣的參數θ能夠使得似然概率取得最大。
過擬合:說的是樣本全是性別為男或者女的情況,即樣本不具有代表性。
7、協方差和相關系數
標準差:方差開平方
協方差:表示兩個變量的離散程度。是方差的一般形式。協方差是兩個隨機變量是否具有相同方向變化趨勢的度量。
相關系數