1. 概率論基本概念回顧
1. 概率分布
定義: 概率分布(Probability Distribution)指的是隨機變量所有可能取值及其對應概率的集合。它描述了一個隨機變量可能取的所有值以及每個值被取到的概率。
- 對于離散型隨機變量,使用概率質量函數來描述。
- 對于連續型隨機變量,使用概率密度函數來描述。
舉例說明: 投擲一顆六面骰子,每個面上的數字(1到6)都有相同的概率(1/6)出現,這就是一個簡單的概率分布例子。
2. 概率函數
定義: 概率函數(Probability Function)是指在離散型隨機變量的情況下,給定一個隨機變量的值時,計算該值發生的概率的函數。
公式: 對于離散型隨機變量 X X X,其概率函數通常表示為 P ( X = x ) P(X=x) P(X=x),即隨機變量 X X X 取某個特定值 x x x 的概率。
舉例說明: 拋一枚公平的硬幣,令 X X X 表示出現正面的情況,則 P ( X = 正面 ) = 0.5 P(X=\text{正面})=0.5 P(X=正面)=0.5。
3. 概率分布函數(累積分布函數)
定義: 概率分布函數(Cumulative Distribution Function, CDF),也稱作累積分布函數,是一個函數,它給出隨機變量小于或等于某個值的概率。
公式: 對于任意實數 a a a,CDF F ( a ) = P ( X ≤ a ) F(a) = P(X \leq a) F(a)=P(X≤a)。
舉例說明: 若 X X X 為一個均勻分布在 [ 0 , 1 ] [0,1] [0,1] 區間上的隨機變量,則 F ( x ) F(x) F(x) 對于 0 ≤ x ≤ 1 0 \leq x \leq 1 0≤x≤1 為 x x x,即 F ( x ) = x F(x) = x F(x)=x。
4. 概率密度函數
定義: 概率密度函數(Probability Density Function, PDF)適用于連續型隨機變量,用來描述連續型隨機變量落在某個確定值附近的概率密度大小。
公式: 對于連續型隨機變量 X X X,其PDF記為 f ( x ) f(x) f(x),滿足條件:
∫ ? ∞ ∞ f ( x ) d x = 1 \int_{-\infty}^{\infty} f(x)dx = 1 ∫?∞∞?f(x)dx=1
并且對于任意兩個實數 a a a 和 b b b ( a < b a < b a<b),隨機變量 X X X 落在區間 [ a , b ] [a, b] [a,b] 內的概率由下面積分給出:
P ( a < X ≤ b ) = ∫ a b f ( x ) d x P(a < X \leq b) = \int_{a}^{b} f(x) dx P(a<X≤b)=∫ab?f(x)dx
2. 統計和貝葉斯
貝葉斯公式
定義: 貝葉斯公式(Bayes’ Theorem)是一種計算條件概率的方法,它允許我們通過已知的某些條件下的事件發生的概率來更新對另一些條件下該事件發生概率的估計。
公式:
P ( A ∣ B ) = P ( B ∣ A ) ? P ( A ) P ( B ) P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)} P(A∣B)=P(B)P(B∣A)?P(A)?
其中,
- P ( A ∣ B ) P(A|B) P(A∣B) 是在事件 B 發生的情況下事件 A 發生的概率,稱為后驗概率。
- P ( B ∣ A ) P(B|A) P(B∣A) 是在事件 A 發生的情況下事件 B 發生的概率,稱為后驗概率。
- P ( A ) P(A) P(A) 和 P ( B ) P(B) P(B) 分別是事件 A 和事件 B 的邊際概率(無條件概率), P ( A ) P(A) P(A) 也被稱為先驗概率。
全概率公式
定義: 全概率公式(Law of Total Probability)提供了一種方法,用于計算一個復雜事件的概率,特別是當這個事件可以被分解為幾個互斥但又完全覆蓋樣本空間的子事件時。
公式:
如果 B 1 , B 2 , . . . , B n B_1, B_2, ..., B_n B1?,B2?,...,Bn? 是一組互斥且窮盡的事件(即它們之間沒有交集,但并集覆蓋了整個樣本空間),則對于任意事件 A,有
P ( A ) = ∑ i = 1 n P ( A ∣ B i ) ? P ( B i ) P(A) = \sum_{i=1}^{n} P(A|B_i) \cdot P(B_i) P(A)=i=1∑n?P(A∣Bi?)?P(Bi?</