文章目錄
- 參考教程
- 一、意義
- 1. 正態分布的 3σ 法則
- 2. 不等式的含義
- 3. 不等式的意義
- 二、不等式的證明
- 1. 馬爾科夫不等式
- 2. 切比雪夫不等式推導
參考教程
一個視頻,徹底理解切比雪夫不等式
一、意義
1. 正態分布的 3σ 法則
- 不等式:切比雪夫不等式 P{∣X?EX∣≥ε}≤DXε2P\{|X - EX| \geq \varepsilon\} \leq \frac{DX}{\varepsilon^2}P{∣X?EX∣≥ε}≤ε2DX?,用于描述隨機變量偏離期望的概率上界
- 法則:正態分布的 3σ 法則
- 分布表示:正態分布 N(μ,σ2)N(\mu, \sigma^2)N(μ,σ2)(圖中標注對應分布形態 )
- 概率占比:
- μ±σ\mu \pm \sigmaμ±σ 區間概率約 68.2%
- μ±2σ\mu \pm 2\sigmaμ±2σ 區間概率約 95.4%
- μ±3σ\mu \pm 3\sigmaμ±3σ 區間概率約 99.7%
2. 不等式的含義
切比雪夫不等式公式的另一種形式:
P{∣X?EX∣<ε}≥1?DXε2P\{|X - EX| < \varepsilon\} \geq 1 - \frac{DX}{\varepsilon^2} P{∣X?EX∣<ε}≥1?ε2DX?
(其中 ( X ) 是隨機變量,( EX ) 為其期望,( DX ) 為方差,( \varepsilon ) 是任意正數 )
∣X?EX∣|X - EX|∣X?EX∣就是X到均值的距離
這個公式就是對∣X?EX∣<ε|X - EX| < \varepsilon∣X?EX∣<ε這件事的概率做估計
3. 不等式的意義
-
當 ε\varepsilonε = σ\sigmaσ 時:
P{∣X?EX∣<σ}≥1?σ2σ2=0P\{|X - EX| < \sigma\} \geq 1 - \frac{\sigma^2}{\sigma^2} = 0 P{∣X?EX∣<σ}≥1?σ2σ2?=0 -
當 ε\varepsilonε = 2σ2\sigma2σ 時:
P{∣X?EX∣<2σ}≥1?σ2(2σ)2=1?14=34=75%P\{|X - EX| < 2\sigma\} \geq 1 - \frac{\sigma^2}{(2\sigma)^2} = 1 - \frac{1}{4} = \frac{3}{4} = 75\% P{∣X?EX∣<2σ}≥1?(2σ)2σ2?=1?41?=43?=75%
由此可見切比雪夫的估計比較保守
假如隨便畫一個分布,求陰影部分概率,切比雪夫不等式告訴我們這個概率一定大于等于75%,這就是其高明之處
二、不等式的證明
1. 馬爾科夫不等式
- 公式:P{Y≥a}≤EYaP\{ Y \geq a \} \leq \frac{EY}{a}P{Y≥a}≤aEY? (YYY 取非負 )
馬爾可夫不等式證明(YYY 為非負隨機變量 )
-
由期望定義,YYY 的數學期望:
EY=∫0+∞y?f(y)dyEY = \int_{0}^{+\infty} y \cdot f(y) \, dyEY=∫0+∞?y?f(y)dy -
因Y≥0Y \geq 0Y≥0,且積分區間可拆分,當y≥ay \geq ay≥a 時y≥ay \geq ay≥a,故:
EY≥∫a+∞y?f(y)dy≥∫a+∞a?f(y)dyEY \geq \int_{a}^{+\infty} y \cdot f(y) \, dy \geq \int_{a}^{+\infty} a \cdot f(y) \, dyEY≥∫a+∞?y?f(y)dy≥∫a+∞?a?f(y)dy -
化簡右側積分:
∫a+∞a?f(y)dy=a?∫a+∞f(y)dy=a?P{Y≥a}\int_{a}^{+\infty} a \cdot f(y) \, dy = a \cdot \int_{a}^{+\infty} f(y) \, dy = a \cdot P\{ Y \geq a \}∫a+∞?a?f(y)dy=a?∫a+∞?f(y)dy=a?P{Y≥a} -
綜上,整理得:
P{Y≥a}≤EYaP\{ Y \geq a \} \leq \frac{EY}{a}P{Y≥a}≤aEY?
2. 切比雪夫不等式推導
-
基礎:馬爾可夫不等式
P{Y≥a}≤EYaP\{ Y \geq a \} \leq \frac{EY}{a}P{Y≥a}≤aEY?
(其中 ( Y ) 為非負隨機變量 ) -
變量代換:
令 Y=(X?EX)2Y = (X - EX)^2Y=(X?EX)2,a=ε2a = \varepsilon^2a=ε2 -
代入推導:
- 第一步推導:
P{(X?EX)2≥ε2}≤E[(X?EX)2]ε2P\{ (X - EX)^2 \geq \varepsilon^2 \} \leq \frac{E\left[(X - EX)^2\right]}{\varepsilon^2}P{(X?EX)2≥ε2}≤ε2E[(X?EX)2]? - 因 E[(X?EX)2]=DXE\left[(X - EX)^2\right] = DXE[(X?EX)2]=DX(方差定義 ),且 (X?EX)2≥ε2?∣X?EX∣≥ε(X - EX)^2 \geq \varepsilon^2 \Leftrightarrow |X - EX| \geq \varepsilon(X?EX)2≥ε2?∣X?EX∣≥ε ,進一步得:
P{∣X?EX∣≥ε}≤DXε2P\{ |X - EX| \geq \varepsilon \} \leq \frac{DX}{\varepsilon^2}P{∣X?EX∣≥ε}≤ε2DX?
- 第一步推導: