概率密度函數(PDF)與概率質量函數(PMF)說明
基本概念區分
對于連續型隨機變量,通常使用 概率密度函數 (Probability Density Function, PDF) 進行描述;這與離散型隨機變量使用的 概率質量函數 (Probability Mass Function, PMF) 有本質區別。
- PMF:可以直接代入變量值求得對應事件的概率
- PDF:代入變量值后得到的是 概率密度值,而非概率本身
連續型隨機變量的概率特性
-
單點概率為零
對于任意實數 xxx,P(X=x)=0P(X = x) = 0P(X=x)=0 -
區間概率計算
連續型變量的概率必須通過積分計算:
P(a≤X≤b)=∫abf(x)dxP(a \leq X \leq b) = \int_{a}^{b} f(x) \, dx P(a≤X≤b)=∫ab?f(x)dx -
概率密度的物理意義
PDF 在某點的取值反映該區域概率的 “密集程度”,其值的大小與概率成正比關系
PDF 的基本性質
-
非負性
f(x)≥0?x∈Rf(x) \geq 0 \quad \forall x \in \mathbb{R} f(x)≥0?x∈R -
歸一性
∫?∞+∞f(x)dx=1\int_{-\infty}^{+\infty} f(x) \, dx = 1 ∫?∞+∞?f(x)dx=1
概率質量函數(PDF)和累積分布函數(CDF)
互逆關系
-
從 PDF 到 CDF:
F(x)=∫?∞xf(t)dtF(x) = \int_{-\infty}^x f(t) \, dt F(x)=∫?∞x?f(t)dt -
從 CDF 到 PDF:
f(x)=ddxF(x)f(x) = \frac{d}{dx} F(x) f(x)=dxd?F(x)
概率計算的等價性
對于任意區間 [a,b][a, b][a,b],概率可表示為:很多情況計算概率時,分布函數使用起來會更簡單一些(避免積分運算);
P(a<X≤b)=F(b)?F(a)=∫abf(x)dx\boxed{P(a < X \leq b) = F(b) - F(a) = \int_a^b f(x) \, dx} P(a<X≤b)=F(b)?F(a)=∫ab?f(x)dx?
均勻分布
應用場景實例
1.在java中使用new Random().nextDouble(),生成一個[0,1][0,1][0,1]之間的雙精度浮點型偽隨機數,數據出現在任意一個區間的可能性是相同的,換言之生成的隨機數,均勻的散布在[0,1][0,1][0,1]之間;
2.某公交車每30分鐘固定發車一次,乘客在任意時刻到達車站。那么乘客的候車時間在[0,30][0,30][0,30]分鐘之間,并且等候任意分鐘([0,30][0,30][0,30])是等可能的;
定義
連續均勻分布(Uniform Distribution)的核心特征是概率密度在整個區間內恒定,即等可能性,是最簡單的連續型概率分布之一。
記法:
X~U(a,b)或X~Uniform(a,b)\boxed{X \sim U(a,b)\quad或\quad X\sim \text{Uniform}(a,b)} X~U(a,b)或X~Uniform(a,b)?
讀作:XXX服從參數為a,ba,ba,b的連續均勻分布;
則例1記為:X~U(0,1)X\sim U(0,1)X~U(0,1)
例2記為:X~U(0,30)X\sim U(0,30)X~U(0,30)
隨機變量
連續型隨機變量XXX,其取值范圍限定在某個有限區間 [a,b][a,b][a,b]內,且在該區間內每個實數的取值概率密度相等。換句話說,XXX 是取值在區間 [a,b][a,b][a,b]上均勻分布的隨機數。
- 例1定義X,X∈[0,1]X,X\in[0,1]X,X∈[0,1]是生成的隨機數的值;
- 例2定義X,X∈[0,30]X,X\in[0,30]X,X∈[0,30]為乘客的等候時間;
參數
連續均勻分布的參數有2個,即左右區間值a,ba,ba,b;隨機變量取值在這個區間內的概率是1;
函數表達
由定義可得
- 在整個定義區間[a,b][a,b][a,b]上,概率均勻分布,即任意一個子集,若區間長度則概率相等.則概率相同
- P(a≤X≤b)=1P(a \le X \le b)=1P(a≤X≤b)=1
由于概率是均勻的,則累積分布函數F(X)F(X)F(X)應該是線性的,并且F(a)=0,F(b)=1F(a)=0,F(b)=1F(a)=0,F(b)=1;
設F(x)=kx+CF(x)=kx+CF(x)=kx+C,并且有:
{F(a)=0F(b)=1\begin{cases} F(a)=0\\ F(b)=1 \end{cases} {F(a)=0F(b)=1?
解得
F(x)=1b?ax?ab?aF(x)=\frac{1}{b-a}x-\frac{a}{b-a} F(x)=b?a1?x?b?aa?
即
F(x)=x?ab?a\boxed{F(x)=\frac{x-a}{b-a}} F(x)=b?ax?a??
故概率密度函數f(x)=F′(x)f(x)=F'(x)f(x)=F′(x)
f(x)={1b?a,a≤X≤b0,其他\boxed{ f(x)= \begin{cases} \frac{1}{b-a}, \quad a \le X \le b \\ 0,\quad 其他 \end{cases}} f(x)={b?a1?,a≤X≤b0,其他??
即,求XXX在[m,n][m,n][m,n]區間上的概率即:
P(m≤X≤n)=∫mn1b?adx=n?mb?a,a≤m≤n≤b\boxed{ P(m \le X \le n) = \int_{m}^{n}\frac{1}{b-a} \, dx=\frac{n-m}{b-a},\quad a \le m \le n \le b} P(m≤X≤n)=∫mn?b?a1?dx=b?an?m?,a≤m≤n≤b?
分布特征值
- 期望,很好理解就是定于區間的juzn
E(X)=a+b2E(X)=\frac{a+b}{2}E(X)=2a+b? - 方差Var(X)=(b?a)212\text{Var}(X)=\frac{(b-a)^2}{12}Var(X)=12(b?a)2?
推導:
對于連續型隨機變量 XXX,其概率密度函數為 f(x)f(x)f(x),期望 E(x)E(x)E(x)定義為:
E(X)=∫?∞+∞x?f(x)dx\begin{align*} E(X)&=\int_{-\infty}^{+\infty}x\cdot f(x)dx\\ \end{align*} E(X)?=∫?∞+∞?x?f(x)dx?
對于服從均勻分布的隨機變量X~U(a,b)X\sim U(a,b)X~U(a,b)則有:
E(X)=∫bax?1b?adx=1b?a∫baxdx=1b?a×[x22]ab=1b?a×b2?a22=a+b2\begin{align*} E(X)&=\int_{b}^{a}x\cdot \frac{1}{b-a}dx\\ &= \frac{1}{b-a}\int_{b}^{a}xdx\\ &= \frac{1}{b-a}\times \left[ \frac{x^2}{2} \right]_{a}^{b}\\ &=\frac{1}{b-a}\times\frac{b^2-a^2}{2}\\ &=\frac{a+b}{2} \end{align*} E(X)?=∫ba?x?b?a1?dx=b?a1?∫ba?xdx=b?a1?×[2x2?]ab?=b?a1?×2b2?a2?=2a+b??
方差 Var(X)\text{Var}(X)Var(X)定義為:
Var(X)=E(X2)?[E(X)]2\text{Var}(X)=E(X^2)-[E(X)]^2 Var(X)=E(X2)?[E(X)]2
對于服從均勻分布的隨機變量X~U(a,b)X\sim U(a,b)X~U(a,b)則有:
E(X2)=∫bax2?1b?adx=1b?a∫bax2dx=1b?a×[x33]ab=1b?a×b3?a33=1b?a×(b?a)(a2+ab+b2)3=a2+ab+b23\begin{align*} E(X^2)&=\int_{b}^{a}x^2\cdot \frac{1}{b-a}dx\\ &= \frac{1}{b-a}\int_{b}^{a}x^2dx\\ &= \frac{1}{b-a}\times \left[ \frac{x^3}{3} \right]_{a}^{b}\\ &=\frac{1}{b-a}\times\frac{b^3-a^3}{3}\\ &=\frac{1}{b-a}\times\frac{(b-a)(a^2+ab+b^2)}{3}\\ &=\frac{a^2+ab+b^2}{3} \end{align*} E(X2)?=∫ba?x2?b?a1?dx=b?a1?∫ba?x2dx=b?a1?×[3x3?]ab?=b?a1?×3b3?a3?=b?a1?×3(b?a)(a2+ab+b2)?=3a2+ab+b2??
E(X)2=(a+b2)2=a2+2ab+b24\begin{align*} E(X)^2&=(\frac{a+b}{2})^2\\ &=\frac{a^2+2ab+b^2}{4} \end{align*} E(X)2?=(2a+b?)2=4a2+2ab+b2??
Var(X)=E(X2)?[E(X)]2=a2+ab+b23?a2+2ab+b24=4a2+4ab+4b2?3a2?6ab?3b212=a2?2ab+b212=(b?a)212\begin{align*} \text{Var}(X)&=E(X^2)-[E(X)]^2\\ &=\frac{a^2+ab+b^2}{3}-\frac{a^2+2ab+b^2}{4}\\ &=\frac{4a^2+4ab+4b^2-3a^2-6ab-3b^2}{12}\\ &=\frac{a^2-2ab+b^2}{12}\\ &=\frac{(b-a)^2}{12} \end{align*} Var(X)?=E(X2)?[E(X)]2=3a2+ab+b2??4a2+2ab+b2?=124a2+4ab+4b2?3a2?6ab?3b2?=12a2?2ab+b2?=12(b?a)2??
自己操作試試吧,可視化查看: 連續均勻分布
例題
從區間[0,1][0,1][0,1]中隨機的選擇一個數,求此數小于0.4的概率?
設隨機變量XXX表示從區間[0,1][0,1][0,1]中隨機選擇的一個數,由題意得X~U(0,1)X\sim U(0,1)X~U(0,1),求P(X<0.4)P(X<0.4)P(X<0.4);
使用概率密度函數計算
P(X<0.4)=∫mn1b?adx=∫00.411?0dx=[x]00.4=0.4P(X<0.4)= \int_{m}^{n}\frac{1}{b-a} \, dx=\int_0^{0.4}\frac{1}{1-0}dx=[x]_0^{0.4}=0.4 P(X<0.4)=∫mn?b?a1?dx=∫00.4?1?01?dx=[x]00.4?=0.4
或使用累積分布函數計算
P(X<0.4)=F(0.4)=F(x)=x?ab?a=0.4?01?0=0.4P(X<0.4)=F(0.4)=F(x)=\frac{x-a}{b-a}=\frac{0.4-0}{1-0}=0.4 P(X<0.4)=F(0.4)=F(x)=b?ax?a?=1?00.4?0?=0.4