文章目錄
- 1. 樣本期望和方差
- 2. Markov 不等式&Chebyshev不等式
- 2.1 Markov不等式公式 概述
- 2.2 Markov不等式公式 證明:
- 2.3 Markov不等式公式 舉例:
- 2.4 Chebyshev不等式公式概述:
- 2.5 Chebyshev不等式公式證明:
- 3. 協方差矩陣
- 3.1 舉例
- 3.2 Python 代碼
1. 樣本期望和方差
1.1 樣本期望 E ( X ) \mathrm{E}(X) E(X)
假設我們有N個樣本及概率如下 x 1 → p 1 , x 2 → p 2 , ? , x n → p n x_1\rightarrow p_1,x_2\rightarrow p_2,\cdots,x_n\rightarrow p_n x1?→p1?,x2?→p2?,?,xn?→pn?,那么樣本期望 E ( X ) E(X) E(X)
E ( X ) = m = ∑ i = 1 N p i x i \begin{equation} \mathrm{E}(X)=m=\sum_{i=1}^Np_ix_i \end{equation} E(X)=m=i=1∑N?pi?xi???
- 函數期望:
E ( f ( x ) ) = m = ∑ i = 1 N p i f ( x i ) \begin{equation} \mathrm{E}(f(x))=m=\sum_{i=1}^Np_if(x_i) \end{equation} E(f(x))=m=i=1∑N?pi?f(xi?)??
1.2 樣本期望 D ( X ) \mathrm{D}(X) D(X)
D ( X ) = σ 2 = E [ ( x i ? m ) 2 ] \begin{equation} \mathrm{D}(X)=\sigma^2=\mathrm{E}[(x_i-m)^2] \end{equation} D(X)=σ2=E[(xi??m)2]??
- 展開可得:
D ( X ) = ∑ i = 1 N p i ( x i ? m ) 2 \begin{equation} \mathrm{D}(X)=\sum_{i=1}^Np_i(x_i-m)^2 \end{equation} D(X)=i=1∑N?pi?(xi??m)2?? - 展開可得:
= p 1 ( x 1 2 + m 2 ? 2 x 1 m ) + p 2 ( x 2 2 + m 2 ? 2 x 2 m ) + ? + p n ( x n 2 + m 2 ? 2 x n m ) \begin{equation} =p_1(x_1^2+m^2-2x_1m)+p_2(x_2^2+m^2-2x_2m)+\cdots+p_n(x_n^2+m^2-2x_nm) \end{equation} =p1?(x12?+m2?2x1?m)+p2?(x22?+m2?2x2?m)+?+pn?(xn2?+m2?2xn?m)??
= p 1 ( x 1 2 + x 2 2 + ? + x n 2 ) + ( p 1 + p 2 + ? + p n ) m 2 ? 2 m ( p 1 x 1 + p 2 x 2 + ? + p n x n ) \begin{equation} =p_1(x_1^2+x_2^2+\cdots+x_n^2)+(p_1+p_2+\cdots+p_n)m^2-2m(p_1x_1+p_2x_2+\cdots+p_nx_n) \end{equation} =p1?(x12?+x22?+?+xn2?)+(p1?+p2?+?+pn?)m2?2m(p1?x1?+p2?x2?+?+pn?xn?)?? - 因為 p 1 + p 2 + ? + p n = 1 , p 1 x 1 + p 2 x 2 + ? + p n x n = m p_1+p_2+\cdots+p_n=1,p_1x_1+p_2x_2+\cdots+p_nx_n=m p1?+p2?+?+pn?=1,p1?x1?+p2?x2?+?+pn?xn?=m
- E ( X 2 ) = p 1 ( x 1 2 + x 2 2 + ? + x n 2 ) , E ( X ) = m = ∑ i = 1 N p i x i \mathrm{E}(X^2)=p_1(x_1^2+x_2^2+\cdots+x_n^2),\mathrm{E}(X)=m=\sum_{i=1}^Np_ix_i E(X2)=p1?(x12?+x22?+?+xn2?),E(X)=m=∑i=1N?pi?xi?
- 整理可得:
D ( X ) = E ( X 2 ) + m 2 ? 2 m 2 = E ( X 2 ) ? [ E ( X ) ] 2 \begin{equation} D(X)=\mathrm{E}(X^2)+m^2-2m^2=\mathrm{E}(X^2)-[\mathrm{E}(X)]^2 \end{equation} D(X)=E(X2)+m2?2m2=E(X2)?[E(X)]2??
2. Markov 不等式&Chebyshev不等式
2.1 Markov不等式公式 概述
假設X是一個均值有限的非負隨機變量,均值為 E ( X ) \mathrm{E}(X) E(X),這意味著 P ( X < 0 ) = 0 P(X<0)=0 P(X<0)=0,那么對于任意的正數a,有
P r o b ( X ≥ a ) ≤ E ( X ) a , X i ≥ 0 \begin{equation} Prob(X\ge a)\le\frac{\mathrm{E}(X)}{a},X_i\ge 0 \end{equation} Prob(X≥a)≤aE(X)?,Xi?≥0??
- 同等公式如下:
P r o b ( X < a ) ≥ 1 ? E ( X ) a \begin{equation} Prob(X< a)\ge 1-\frac{\mathrm{E}(X)}{a} \end{equation} Prob(X<a)≥1?aE(X)???
2.2 Markov不等式公式 證明:
我們定義樣本分布的概率密度為 f ( x ) f(x) f(x),如下圖所述:
- 我們可以得到期望E(X)表示如下:
E ( X ) = ∫ 0 ∞ x f ( x ) d x \begin{equation} \mathrm{E}(X)=\int_{0}^{\infty}xf(x)\mathrm{d}x \end{equation} E(X)=∫0∞?xf(x)dx?? - 因為 x , f(x)我們定義均大于等于0,所以可以進行縮放,將原來積分從0到正無窮縮小到a到正無窮
∫ 0 ∞ x f ( x ) d x ≥ ∫ a ∞ x f ( x ) d x \begin{equation} \int_{0}^{\infty}xf(x)\mathrm{d}x\ge\int_{a}^{\infty}xf(x)\mathrm{d}x \end{equation} ∫0∞?xf(x)dx≥∫a∞?xf(x)dx?? - 因為每個x現在都大于等于a, x ≥ a x\ge a x≥a,所以可以將系數x縮放為a,即:
∫ 0 ∞ x f ( x ) d x ≥ ∫ a ∞ x f ( x ) d x ≥ ∫ a ∞ a f ( x ) d x = a ∫ a ∞ f ( x ) d x \begin{equation} \int_{0}^{\infty}xf(x)\mathrm{d}x\ge\int_{a}^{\infty}xf(x)\mathrm{d}x\ge\int_{a}^{\infty}af(x)\mathrm{d}x=a\int_{a}^{\infty}f(x)\mathrm{d}x \end{equation} ∫0∞?xf(x)dx≥∫a∞?xf(x)dx≥∫a∞?af(x)dx=a∫a∞?f(x)dx?? - 這里的 ∫ a ∞ f ( x ) d x = P ( X ≥ a ) \int_{a}^{\infty}f(x)\mathrm{d}x=P(X\ge a) ∫a∞?f(x)dx=P(X≥a),則整理上面公式可得:
E ( X ) ≥ a P ( X ≥ a ) → P ( X ≥ a ) ≤ E ( X ) a \begin{equation} \mathrm{E}(X)\ge a P(X\ge a)\rightarrow P(X\ge a)\le \frac{\mathrm{E}(X)}{a} \end{equation} E(X)≥aP(X≥a)→P(X≥a)≤aE(X)??? - 綜上所述,我們得到馬爾科夫不等式如下:
P ( X ≥ a ) ≤ E ( X ) a \begin{equation} P(X\ge a)\le \frac{\mathrm{E}(X)}{a} \end{equation} P(X≥a)≤aE(X)??? - 假設樣本和概率表示如下:
Sample | x 1 = 1 x_1=1 x1?=1 | x 2 = 2 x_2=2 x2?=2 | x 3 = 3 x_3=3 x3?=3 | x 4 = 4 x_4=4 x4?=4 | x 5 = 5 x_5=5 x5?=5 |
---|---|---|---|---|---|
P | p 1 p_1 p1? | p 2 p_2 p2? | p 3 p_3 p3? | p 4 p_4 p4? | p 5 p_5 p5? |
E ( X ) = p 1 x 1 + p 2 x 2 + p 3 x 3 + p 4 x 4 + p 5 x 5 \begin{equation} \mathrm{E}(X)=p_1x_1+p_2x_2+p_3x_3+p_4x_4+p_5x_5 \end{equation} E(X)=p1?x1?+p2?x2?+p3?x3?+p4?x4?+p5?x5???
- 我們假設期望為1 , E ( X ) = 1 \mathrm{E}(X)=1 E(X)=1
- E ( X ) = p 1 x 1 + p 2 x 2 + p 3 x 3 + p 4 x 4 + p 5 x 5 = 1 \begin{equation} \mathrm{E}(X)=p_1x_1+p_2x_2+p_3x_3+p_4x_4+p_5x_5=1 \end{equation} E(X)=p1?x1?+p2?x2?+p3?x3?+p4?x4?+p5?x5?=1?? - X>3的概率如下:
P r o b ( X ≥ 3 ) ≤ E ( X ) 3 → P r o b ( X ≥ 3 ) ≤ 1 3 \begin{equation} Prob(X\ge 3)\le\frac{\mathrm{E}(X)}{3}\rightarrow Prob(X\ge 3)\le\frac{1}{3}\end{equation} Prob(X≥3)≤3E(X)?→Prob(X≥3)≤31???
p 3 + p 4 + p 5 ≤ 1 3 \begin{equation} p_3+p_4+p_5\le\frac{1}{3}\end{equation} p3?+p4?+p5?≤31???
2.3 Markov不等式公式 舉例:
假設Andrew在平時工作一個星期中平均下來一個星期會犯 4
次錯,也就是期望 E ( X ) = 4 \mathrm{E}(X)=4 E(X)=4,那么我們想知道如果Andrew在平時工作一個星期中會犯 10
次以上的錯的概率多少?轉換到數學公式如下:
E ( X ) = 4 , P r o b ( X > 10 ) ≤ E ( X ) 10 → P r o b ( X > 10 ) ≤ 40 % \begin{equation} \mathrm{E}(X)=4, Prob(X>10)\le \frac{\mathrm{E}(X)}{10}\rightarrow Prob(X>10)\le40\% \end{equation} E(X)=4,Prob(X>10)≤10E(X)?→Prob(X>10)≤40%??
- 也就是說Andrew 在平時一個星期中犯錯10次以上的概率不會超過 40 % 40\% 40%
2.4 Chebyshev不等式公式概述:
如果隨機變量X的期望 μ \mu μ,方差 σ \sigma σ存在,則對于任意 ? > 0 \epsilon >0 ?>0,有如下公式:
P ( ∣ X ? μ ∣ ≥ ? ) ≤ σ 2 ? 2 \begin{equation} P{(|X-\mu|\ge \epsilon)}\le \frac{\sigma^2}{\epsilon^2} \end{equation} P(∣X?μ∣≥?)≤?2σ2???
2.5 Chebyshev不等式公式證明:
我們已經證明了馬爾科夫不等式表示如下:
P ( Y ≥ a ) ≤ E ( Y ) a \begin{equation} P(Y\ge a)\le \frac{\mathrm{E}(Y)}{a} \end{equation} P(Y≥a)≤aE(Y)???
- 這里我們令 Y = ( X ? μ ) 2 , a = ? 2 Y=(X-\mu)^2,a=\epsilon^2 Y=(X?μ)2,a=?2代入到公式中:
P ( ( X ? μ ) 2 ≥ ? 2 ) ≤ E ( ( X ? μ ) 2 ) ? 2 \begin{equation} P((X-\mu)^2\ge \epsilon^2)\le \frac{\mathrm{E}((X-\mu)^2)}{\epsilon^2} \end{equation} P((X?μ)2≥?2)≤?2E((X?μ)2)??? - 我們可以發現 P ( ( X ? μ ) 2 ≥ ? 2 ) P((X-\mu)^2\ge \epsilon^2) P((X?μ)2≥?2)等效于 P ( ∣ X ? μ ∣ ≥ ? ) P(|X-\mu|\ge \epsilon) P(∣X?μ∣≥?), σ 2 = E ( ( X ? μ ) 2 ) \sigma^2=\mathrm{E}((X-\mu)^2) σ2=E((X?μ)2)
- 整理上述公式可得切爾雪夫不等式結果:
P ( ∣ X ? μ ∣ ≥ ? ) ≤ σ 2 ? 2 \begin{equation} P(|X-\mu|\ge \epsilon)\le \frac{\sigma^2}{\epsilon^2} \end{equation} P(∣X?μ∣≥?)≤?2σ2???
3. 協方差矩陣
設 Ω \Omega Ω為樣本空間,P是定義在 Ω \Omega Ω的事件族 Σ \Sigma Σ上的概率,換句話來說, Ω , Σ , P \Omega,\Sigma,P Ω,Σ,P是個概率空間;若X與Y定義在 Ω \Omega Ω上兩個實數隨機變量,期望分別為:
E ( X ) = ∫ Ω X d P = μ ; E ( Y ) = ∫ Ω Y d P = v ; \begin{equation} \mathrm{E}(X)=\int_{\Omega}X\mathrm{d}P=\mu;\mathrm{E}(Y)=\int_{\Omega}Y\mathrm{d}P=v; \end{equation} E(X)=∫Ω?XdP=μ;E(Y)=∫Ω?YdP=v;??
- 則兩者間的協方差定義為:
c o v ( X , Y ) = E [ ( X ? μ ) ( Y ? v ) ] \begin{equation} \mathrm{cov}(X,Y)=\mathrm{E}[(X-\mu)(Y-v)] \end{equation} cov(X,Y)=E[(X?μ)(Y?v)]??
3.1 舉例
[感覺老師舉的例子不好]
假設我們有兩個硬幣,X,Y 正反的概率均為0.5,那么概率矩陣為:
- 當兩個硬幣單獨扔下去時,概率矩陣如下:
Sample | x 1 = 正 x_1=正 x1?=正 | x 2 = 反 x_2=反 x2?=反 |
---|---|---|
y 1 = 正 y_1=正 y1?=正 | 1 4 \frac{1}{4} 41? | 1 4 \frac{1}{4} 41? |
y 2 = 反 y_2=反 y2?=反 | 1 4 \frac{1}{4} 41? | 1 4 \frac{1}{4} 41? |
- 當兩個硬幣粘貼在一起扔下去時,概率矩陣如下:
Sample | x 1 = 正 x_1=正 x1?=正 | x 2 = 反 x_2=反 x2?=反 |
---|---|---|
y 1 = 正 y_1=正 y1?=正 | 1 2 \frac{1}{2} 21? | 0 0 0 |
y 2 = 反 y_2=反 y2?=反 | 0 0 0 | 1 2 \frac{1}{2} 21? |
- 當三個硬幣單獨扔下去時,兩個硬幣用平面表示,三個硬幣用立方體表示
P H H H = 1 8 \begin{equation} P_{HHH}=\frac{1}{8} \end{equation} PHHH?=81???
3.2 Python 代碼
C O V ( X , Y ) = 0.14516142787498987 \mathrm{COV}(X,Y)= 0.14516142787498987 COV(X,Y)=0.14516142787498987
import numpy as np
import matplotlib.pyplot as plt# Generate some data
x = np.random.rand(100)
y = 2 * x + np.random.normal(0, 0.1, 100) # y is roughly 2 times x with some noise# Calculate the covariance matrix
cov_matrix = np.cov(x, y)# Extract the covariance value
cov_xy = cov_matrix[0, 1]print(f"Covariance between x and y: {cov_xy}")# Plotting the data
plt.scatter(x, y)
plt.title('Scatter plot of x and y')
plt.xlabel('x')
plt.ylabel('y')
plt.show()