Beta分布是一種定義在區間 ([0, 1]) 上的連續概率分布,常用于描述比例或概率的不確定性。它的形狀由兩個正參數 (\alpha)(alpha)和 (\beta)(beta)控制,能夠呈現多種形態(如對稱、偏態、U型等)。
1. 概率密度函數(PDF)
Beta分布的概率密度函數為:
f ( x ; α , β ) = x α ? 1 ( 1 ? x ) β ? 1 B ( α , β ) , x ∈ [ 0 , 1 ] f(x; \alpha, \beta) = \frac{x^{\alpha-1}(1-x)^{\beta-1}}{B(\alpha, \beta)}, \quad x \in [0, 1] f(x;α,β)=B(α,β)xα?1(1?x)β?1?,x∈[0,1]
其中:
- (B(\alpha, \beta)) 是Beta函數,用于歸一化:
B ( α , β ) = ∫ 0 1 t α ? 1 ( 1 ? t ) β ? 1 d t = Γ ( α ) Γ ( β ) Γ ( α + β ) B(\alpha, \beta) = \int_0^1 t^{\alpha-1}(1-t)^{\beta-1} dt = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha + \beta)} B(α,β)=∫01?tα?1(1?t)β?1dt=Γ(α+β)Γ(α)Γ(β)? - (\Gamma(\cdot)) 是伽馬函數(Gamma function),滿足 (\Gamma(n) = (n-1)!) 對正整數 (n)。
2. 分布的形狀
Beta分布的形狀由 (\alpha) 和 (\beta) 決定:
- 對稱分布:當 (\alpha = \beta) 時,分布對稱(如 (\alpha=\beta=1) 時為均勻分布;(\alpha=\beta=2) 時為鐘形)。
- 偏態分布:
- (\alpha > \beta):左偏(峰值靠近1)。
- (\alpha < \beta):右偏(峰值靠近0)。
- 極端形態:
- (\alpha, \beta < 1):U型(集中在0和1附近)。
- (\alpha = 1, \beta > 1):遞減。
- (\beta = 1, \alpha > 1):遞增。
典型例子:
參數 ((\alpha, \beta)) | 形狀描述 | 示例場景 |
---|---|---|
((1, 1)) | 均勻分布(Flat) | 無先驗信息時假設。 |
((2, 2)) | 對稱鐘形(峰值在0.5) | 硬幣公平性的溫和先驗。 |
((5, 1)) | 極端右偏(峰值靠近1) | 成功概率很高的場景。 |
((0.5, 0.5)) | U型(雙峰在0和1) | 兩極分化強烈的比例(如點擊率)。 |
3. 可視化示例
下圖展示了不同參數組合下的Beta分布形狀:
- 紅色曲線:((0.5, 0.5)) → U型。
- 藍色曲線:((5, 1)) → 左偏。
- 綠色曲線:((2, 5)) → 右偏。
- 黑色曲線:((1, 1)) → 均勻分布。
4. 統計性質
- 期望(均值):
E [ X ] = α α + β E[X] = \frac{\alpha}{\alpha + \beta} E[X]=α+βα? - 方差:
Var ( X ) = α β ( α + β ) 2 ( α + β + 1 ) \text{Var}(X) = \frac{\alpha \beta}{(\alpha + \beta)^2 (\alpha + \beta + 1)} Var(X)=(α+β)2(α+β+1)αβ? - 眾數(峰值點)(當 (\alpha, \beta > 1)):
Mode = α ? 1 α + β ? 2 \text{Mode} = \frac{\alpha - 1}{\alpha + \beta - 2} Mode=α+β?2α?1?
5. 應用場景
Beta分布常用于:
- 貝葉斯統計:作為二項分布參數的共軛先驗(如點擊率、轉化率)。
- A/B測試:建模兩個版本的勝率。
- 概率建模:描述任何有界區間(如用戶評分、完成率)。
6. 與其他分布的關系
- 二項分布:Beta分布是二項分布參數 (p) 的共軛先驗。
- 均勻分布:當 (\alpha = \beta = 1) 時,Beta分布退化為均勻分布。
總結
Beta分布是一個靈活的概率分布,通過調整 (\alpha) 和 (\beta) 可以模擬從均勻分布到極端偏態的各種形態,特別適合建模比例或概率的不確定性。其數學性質良好,是貝葉斯分析中的核心工具之一。